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智能 优化 方法 是 一 个 近年 来 发 展 起 来 的 非常 活跃 的 研究 领域 。 系 统 
工程 、 自 动 化 、 计 算 机 、 管 理工 程 、 采 矿 、 机 械 等 许多 专业 的 学 者 和 学 
生 都 在 广泛 地 采用 智能 优化 方法 。 比 如 ， 遗 传 算法 、 禁 尽 搜索 算法 、 模 
拟 退 火 算法 、 蚁 群 算法 和 粒子 群 优化 算法 等 在 国民 经 济 的 各 个 行业 中 都 
获得 了 广泛 的 应 用 。 

目前 ， 国 内 出 版 的 一 些 智能 优化 方法 相关 著作 主要 集中 在 遗传 、 禁 
尽 搜索 和 模拟 退火 等 发 展 较 早 的 算法 方面 ， 而 近年 来 备 受 各 界 人 士 推 崇 
的 蚁 群 算法 和 粒子 群 优化 算法 以 及 捕食 搜索 算法 、 动 态 进化 算法 介绍 很 
少 。 另 外 ， 国 内 出 版 的 有 关 智 能 优化 方法 书籍 大 多 是 学 术 性 较 强 的 专 
著 ， 并 不 适 于 一 般 学 生 学 习 使 用 ， 读 者 群 也 相对 较 小 。 

编者 自 1996 年 起 就 开始 在 东北 大 学 讲授 “智能 优化 方法 ”这 门 研 
究 生 课 程 ， 并 在 研究 中 大 量 应 用 这 些 算法 来 解决 各 种 实际 中 的 优化 问 
题 ,积累 了 很 多 学 习 、 应 用 和 传授 这 些 算法 的 经 验 。 我 们 的 目的 是 为 希 
望 了 解 、 学 习 这 个 领域 的 学 生 和 学 者 提供 一 本 通俗 易 懂 、 由 浅 入 深 的 教 
科 书 ， 而 不 是 一 本 对 某 个 专题 深入 讨论 、 艰 深 的 学 术 专 著 。 本 教材 把 智 
能 优化 的 各 种 主要 方法 都 赛 括 其 中 ,包括 : 遗传 算法 、 禁 忌 搜 索 算 法 
模拟 退火 算法 、 蚁 群 算法 、 粒 子 群 优化 算法 、 捕 食 搜索 算法 和 动态 进化 
算法 。 所 以 本 教材 是 一 本 对 智能 优化 方法 进行 全 面 介 绍 的 入 门 书 。 

本 教材 每 一 章 中 ， 主 要 介绍 算法 的 产生 、 算 法 的 基本 思想 和 理论 、 
算法 的 基本 构成 、 计 算 步 又 、 主 要 的 变形 算法 、 几 个 数值 举例 和 应 用 ， 
而 不 去 深入 地 讨论 算法 的 理论 。 各 章 之 后 附 有 精 选 的 参考 文献 ， 有 深入 
研究 兴趣 的 读者 ， 还 可 以 根据 参考 文献 的 索引 去 查阅 其 他 专门 的 文献 和 
书籍 。 为 了 方便 学 生 学 习 ， 各 章 后 都 附 有 习题 与 思考 题 ， 通 过 课 后 练习 
可 以 加 深 学 生 对 课程 内 容 的 理解 。 

本 教材 共 分 为 9 章 ， 各 章节 的 内 容 安排 如 下 : 第 1 章 介 绍 智能 优化 
方法 的 产生 与 发 展 ; 第 2 章 介绍 伪 随 机 数 的 产生 ; 第 3 章 ~ 第 7 章 是 本 
书 的 主干 ,分别 介绍 遗传 算法 、 禁 尽 搜索 算法 、 模 拟 退 火 算法 、 蚁 群 算 
法 和 粒子 群 优化 算法 ; 第 8 章 介绍 近年 来 新 出 现 的 捕食 搜索 算法 ; 第 9 
章 讨论 动态 进化 算法 ; 最 后 在 结束 语 中 介绍 了 作者 对 未 来 优化 方法 发 展 
趋势 的 看 法 。 


n 前 言 


本 教材 是 根据 汪 定 伟 教 授 的 课程 讲义 编写 的 。 由 于 原 讲义 主要 讲述 
遗传 算法 、 茜 尽 搜 索 算 法 和 模拟 退火 算法 ， 其 他 算法 仅仅 只 有 一 个 简 
介 ， 而 且 这 些 算 法 很 多 内 容 都 需要 更 新 ， 因 此 各 撰写 人 为 之 付出 了 很 多 
心血 和 劳动 。 各 章节 的 撰写 分 工 如 下 : 

汪 定 伟 : BLE, 第 2 章 和 结束 语 

王 俊 伟 : 第 3 章 , 第 7 章 和 第 8 章 

王 洪峰 : 第 5 章 和 第 9 章 

张 瑞 友 : 第 4 章 

HY: 第 6 章 

最 后 由 汪 定 伟 校 赔 、 统 调 、 定 稿 。 由 于 智能 优化 方法 发 展 很 快 ， 相 
关 名 词 和 术语 亦 更 新 较 快 ， 故 难以 统一 。 限 于 编者 的 水 平 ， 书 中 的 错误 
之 处 在 所 难免 ， 尽 请 广大 读者 指正 。 

本 教材 的 出 版 得 到 了 东北 大 学 研究 生 优秀 教材 基金 的 资助 ， 并 且 得 
到 了 国家 自然 科学 基金 重点 项 目 和 创新 团队 项 目 (70431003, 
60521003) 以 及 教育 部 流程 工业 综合 自动 化 重点 实验 室 的 经 费 资助 ， 在 
此 表示 感谢 。 本 教材 在 编写 和 出 版 中 还 得 到 了 高 等 教育 出 版 社 研究 生 教 
育 与 学 术 分 社 刘 英 编辑 和 其 他 同志 的 支持 和 帮助 ， 在 此 一 并 表示 走 心 的 
感谢 。 
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第 1 章 智能 优化 方法 的 
产生 与 发 展 


本 章 首先 介绍 最 优化 的 重要 意义 ， 然 后 从 分 析 传统 优化 方法 的 基本 
步骤 及 其 局 限 性 人 手 ， 讨 论 实际 中 对 新 的 优化 方法 的 需求 ， 介 绍 智 能 优 
化 方法 的 产生 、 发 展 和 主要 特点 。 最 后 简单 地 介绍 近年 来 最 优化 发 展 的 
一 些 新 动向 。 


11 最 优化 的 重要 意义 


人 类 一 切 活动 的 实质 不 外 乎 是 “认识 世界 ， 建 设 世 界 "”。 认 识 世界 
靠 的 是 建立 模型 ， 简 称 建 模 ;建设 世界 靠 的 是 优化 决策 ， 所 以 “ 建 模 
与 优化 ”可 以 说 无 所 不 在 ， 它 们 始终 贯穿 在 一 切 人 类 活动 的 过 程 之 中 。 

从 概念 模型 、 结 构 模型 ， 到 数学 模型 以 及 计算 机 仿真 模型 和 实物 模 
型 ， 是 模型 的 不 同 阶段 。 从 某 种 意义 上 说 ， 人 类 的 一 切 知识 不 外 乎 是 人 
类 对 某 个 领域 的 现象 和 过 程 认识 的 模型 。 只 是 由 于 不 同 领域 问题 的 模型 
化 的 难 易 程 度 不 同 ， 其 模型 处 在 不 同 的 阶段 。 比 如 ， 数 学 、 力 学 、 微 观 
经 济 学 等 ， 其 知识 基本 上 是 用 数学 模型 来 表达 的 ;而 哲学 、 社 会 学 、 心 
理学 等 ， 由 于 许多 因素 难以 定量 化 ， 其 模型 大 多 还 处 在 概念 模型 阶段 。 

认识 世界 的 目的 是 为 了 建设 世界 ， 同 样 建 模 的 目的 就 是 为 了 优化 。 
建设 世界 首先 必须 认识 世界 ， 同 样 一 切 优化 都 离 不 开 模型 。 比 如 ， 建 设 
一 个 水 电站 首先 要 认识 河流 的 水 文 规律 ， 而 只 有 综合 考虑 淹没 损失 、 水 
坝 造价 和 发 电 效益 ， 选 择 最 优 的 建设 方案 ,才能 确保 水 电站 建设 的 
成 功 。 

最 优化 离 不 开 模型 ， 所 以 最 优化 方法 的 发 展 正 是 随 着 模型 描述 方法 
的 发 展 而 发 展 起 来 的 。 代 数学 中 解析 函数 的 发 展 ， 产 生 了 极 值 理论 ， 这 
是 最 早 的 无 约束 的 函数 优化 方法 。 而 拉 格 朗 日 乘 子 法 则 是 最 早 的 约束 优 
化 方法 。 第 二 次 世界 大 战 时 期 ， 英 国 为 了 最 有 效 地 利用 有 限 的 战争 资 
源 ， 成 立 了 作战 研究 小 组 ， 取 得 了 良好 的 效果 。 战 后 ， 作 战 研究 的 优化 
思想 被 运用 到 运输 管理 、 生 产 管 理 和 一 些 经 济 学 问题 中 ， 于 是 形成 了 以 
线性 规划 、 博 弈 论 等 为 主干 的 运筹 学 。 运 筹 学 的 英文 名 正 是 “作战 研 
JE (Operation Research)”， 其 精髓 就 是 要 在 用 约束 条 件 表述 的 限制 下 ， 
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实现 用 目标 函数 表述 的 某 个 目标 的 最 优化 。 线 性 规划 、 非 线性 规划 、 动 
态 规划 、 博 弈 论 、 排 队 论 、 存 储 论 等 ， 这 些 运筹 学 的 模型 使 最 优化 方法 
的 发 展 达到 了 极致 ， 从 而 开启 了 最 优化 的 辉煌 时 代 。 

除了 在 军事 领域 里 的 成 功 运用 ， 最 优化 在 国际 经 济 的 各 个 领域 里 都 
获得 了 广泛 的 运用 。 运 输 计划 、 工 厂 选 址 、 设 备 布置 、 生 产 计 划 、 作 业 
调度 、 商 品 定价 、 材 料 切割 、 广 告 策略 、 路 径 选择 、 工 作 指派 …… 各 种 
各 样 的 典型 问题 都 在 应 用 最 优化 方法 。 钢 铁 、 采 矿 、 运 输 、 制 造 业 等 
各 行 各 业 都 在 运用 最 优化 。 

对 个 人 来 说 ， 家 庭 理 财 、 职 业 选 择 、 人 生计 划 、 作 息 安排 ,生活 的 
方方面面 都 可 以 运用 最 优化 方法 。 可 以 说 ， 最 优化 是 人 类 智慧 的 精华 
会 不 会 最 优化 是 个 人 聪明 才智 的 表征 。 最 优化 水 平 的 高 低 直接 反映 了 一 
个 人 智力 和 受 教 育 水 平 的 高 低 。 

这 本 书 讲述 的 就 是 最 新 且 最 实用 的 优化 方法 。 


1.2. 传统 优化 方法 的 基本 步 又 及 其 局 限 性 
1 传统 优化 方法 的 基本 步骤 


传统 的 优化 方法 主要 指 : 线性 规划 的 单纯 形 法 ， 非 线性 规划 的 基于 
梯度 的 各 类 选 代 算 法 。 这 类 算法 的 基本 步骤 包括 如 下 3 个 步骤 ， 如 图 


1.1 所 示 。 
1. 选择 一 个 初始 解 


N 
3. 向 改进 方向 移动 


图 1.1 传统 优化 方法 的 基本 步骤 

第 1 步 : 选择 一 个 初始 解 

传统 的 优化 方法 总 是 从 选择 初始 解 开始 ， 一 般 说 来 ， 这 个 初始 解 还 
必须 是 可 行 解 。 比 如 线性 规划 的 单纯 形 法 ， 首 先 要 用 大 M 法 ,或 二 阶 
段 法 来 找到 一 个 基础 可 行 解 。 对 于 无 约束 的 非 线性 函数 优化 问题 ， 初 始 
解 一 般 可 以 任 选 ， 但 是 对 带 约 东 的 非 线性 规划 问题 ， 通 常 也 必须 选择 可 
行 解 作为 初始 解 。 

第 2 步 : 判断 停止 准则 是 否 满足 

这 一 步 是 对 现行 解 检验 是 否 满足 停止 准则 。 停 止 准则 通常 就 是 最 优 
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性 条 件 。 比 如 ， 对 于 线性 规划 的 单纯 形 法 ， 若 检验 数 向 量 
7T-C;B'N-C,20 (1.1) 
则 满足 最 优 性 条 件 ， 停 机 ; BMWA KR. 
RE, B, N 分 别 是 约 东 矩阵 中 基础 变量 和 非 基础 变量 对 应 的 部 
分 ; Cs 和 Cw 是 价格 向 量 中 基础 变量 和 非 基 础 变量 对 应 的 部 分 。 
对 于 无 约束 的 非 线性 函数 优化 问题 ， 检 验 梯度 函数 V(x") =0 是 否 
成 立 。 
对 于 非 线性 规划 问题 ， 则 必须 检验 Kuhn - Turker 条 件 
V f(x!) —ATh(x') -a'g(s*) =0 (1.2) 
是 否 成 立 。 其 中 , h(x) 和 g(x) 分 别 是 等 式 约束 和 不 等 式 约束 函数 向 
量 。 
第 3 步 : 向 改进 方向 移动 
当 最 优 性 条 件 不 能 满足 时 ， 就 必须 向 改进 解 的 方向 移动 。 比 如 对 于 
线性 规划 的 单纯 形 法 ， 即 做 转轴 变换 ， 旋 出 一 个 基础 变量 ， 旋 人 一 个 非 
MME HE, AEE LR AO EP A, SERRE ERS, 
MEMBER E, 3E SE BR DE 7 6] s f D E B JC SEP HE Zr T, BU 
x! 2a! -a V f(x") (1.3) 
这 里 ，a 是 移动 步 长 ， 通 常用 一 维 搜索 的 方法 来 确定 。 Vf(x*) 表示 当 
前 解 x ROB BE, HENEB BE RAA IE HY SE YEB BEDT I o 
2. 传统 优化 方法 的 局 限 性 
传统 优化 方法 的 这 种 计算 构架 给 它 带 来 了 一 些 难 以 克服 的 局 限 性 。 
这 些 局 限 性 主要 表现 在 以 下 几 个 方面 。 
(1) 单 点 运算 方式 大 大 限制 了 计算 效率 的 提高 
传统 优化 方法 是 从 一 个 初始 解 出 发 ， 每 次 迭代 中 也 只 对 一 个 点 进行 
计算 ， 这 种 方法 很 难 发 挥 出 现代 计算 机 高 速 计算 的 性 能 。 特 别 是 高 性 能 
的 多 CPU 的 计算 机 和 现代 并 行 计算 模式 在 传统 优化 方法 中 很 难 应 用 ， 
这 样 就 限制 了 算法 计算 速度 和 求解 大 规模 问题 的 能 力 。 
(2) 向 改进 方向 移动 限制 了 跳出 局 部 最 优 的 能 力 
传统 的 优化 方法 要 求 每 一 步 选 代 都 向 改进 方向 移动 ， 即 每 一 步 都 要 
求 能 够 降低 目标 函数 值 ， 这 样 算 法 就 不 可 能 具有 “有 疏 山 ”能 力 。 一 且 
算法 进入 某 个 局 部 的 低谷 ， 就 只 能 局 限 在 这 个 低谷 区 域内 ， 不 可 能 搜索 
该 区 域 之 外 的 其 他 区 域 。 这 样 ， 算 法 就 失去 了 宝贵 的 全 局 搜索 能 力 。 
(3) 停止 条 件 只 是 局 部 最 优 性 的 条 件 
传统 最 优化 方法 的 梯度 为 零 或 Kuhn. - Turker 条 件 只 是 最 优 解 的 必 
要 条 件 ， 并 不 是 充分 必要 条 件 。 因 此 这 个 条 件 即 使 从 理论 上 看 也 不 是 充 
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分 的 ， 即 满足 停止 条 件 的 解 也 不 能 保证 就 是 最 优 解 。 只 有 当 解 的 可 行 域 
是 凸 集 ， 目 标 函 数 是 凸 函数 时 ， 即 满足 所 谓 的 “ 双 凸 ”条 件 时 ， 才 能 
保证 获得 的 解 是 全 局 最 优 解 。 这 种 “ 双 凸 ”条 件 对 于 大 多 数 实际 问题 
往往 很 难 满足 ， 这 就 大 大 限制 了 传统 优化 方法 的 应 用 范围 。 

(4) 对 目标 函数 和 约束 函数 的 要 求 限制 了 算法 的 应 用 范围 

传统 的 优化 方法 通常 要 求 目标 函数 和 约束 函数 是 连续 可 微 的 解析 函 
数 ， 有 的 算法 甚至 要 求 这 些 函 数 是 高 阶 可 微 的 ， 比 如 牛顿 法 。 实 际 中 ， 
这 样 的 条 件 往往 很 难 满足 。 比 如 ,价格 可 能 存在 批量 折扣 ， 生 产能 力 可 
能 有 跳 路 性 变化 ， 机 器 开 、 停 有 起 动 费用 ， 这 些 因 素 都 可 能 造成 目标 函 
数 只 是 分 段 连续 的 。 这 样 ， 传 统 优化 方法 对 目标 函数 和 约束 函数 的 严格 
要 求 使 其 应 用 范围 大 打折 扣 。 

任何 一 种 新 方法 在 其 产生 的 初期 往往 是 “方法 定向 (Method Orien- 
ted) ”的 ， 即 它 只 能 解决 满足 该 方法 适用 条 件 的 问题 。 要 想 运用 这 种 方 
法 就 必须 简化 或 改变 原来 的 问题 ， 使 之 能 够 满足 该 方法 的 适用 条 件 。 比 
如 ， 为 了 使 用 线性 规划 超 强 的 计算 能 力 ， 实 际 中 往往 不 得 不 采用 拟 线性 
化 或 分 段 线性 化 的 方法 把 非 线性 问题 转化 成 线性 问题 。20 世纪 70 年 代 
未 流行 过 这 样 一 个 十 分 形象 的 比喻 ， 说 最 优化 方法 好 像 是 “只 卖 一 个 
尺码 鞋 的 鞋 店 "” ， 脚 小 的 塞 棉花 ， 脚 大 的 砍 一 截 。 

传统 优化 方法 是 初级 阶段 的 优化 方法 。 随 着 人 们 对 优化 方法 的 要 求 
的 提高 ， 它 的 这 种 “方法 定向 ”的 特征 引起 了 人 们 的 非议 和 质疑 ， 于 
是 在 20 世纪 70 年 代 前 后 ， 运 筹 学 的 发 展 出 现 了 一 个 低谷 期 。 这 正 是 传 
统 优化 方法 局 限 性 的 真实 写照 。 


1.3 智能 优化 方法 的 产生 与 发 展 


针对 传统 优化 方法 的 不 足 ， 人 们 对 最 优化 提出 了 一 些 新 的 需求 。 这 
些 需求 主要 包括 以 下 几 个 方面 。 

1. 对 目标 函数 和 约束 函数 表达 的 要 求 必 须 更 为 宽松 

实际 问题 希望 目标 函数 和 约束 函数 可 以 不 必 是 解析 的 ， 更 不 必 是 连 
续 和 高 阶 可 微 的 。 目 标 函 数 和 约束 函数 中 可 以 含有 规则 、 条 件 和 逻辑 关 
系 ， 甚 至 只 要 一 段 计 算 机 程序 可 以 描述 的 关系 能 够 输出 一 个 返回 值 ， 就 
可 以 作为 目标 函数 或 约束 函数 使 用 。 这 样 ， 分 段 连续 函数 、“ 正 … 
THEN…” 语 句 都 可 以 用 来 表述 目标 和 约束 。 于 是 ， 以 规则 形式 表达 的 
知识 和 人 的 经 验 都 可 以 嵌 和 人 到 优 化 模型 之 中 。 这 样 的 模型 已 经 不 再 是 传 
统 的 数学 模型 ， 而 是 智能 模型 。 
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2. 计算 的 效率 比 理 论 上 的 最 优 性 更 重要 

传统 的 优化 方法 是 方法 定向 的 ， 所 以 它 比较 注重 理论 的 最 优 性 。 但 
是 实际 问题 并 不 介意 获得 的 解 是 不 是 理论 上 最 优 的 ， 而 更 加 注重 的 是 计 
算 的 效率 。 由 于 实际 问题 的 复杂 性 ， 往 往 造 成 问题 的 规模 很 大 ， 时 效 性 
很 高 。 比 如 ， 复 杂 制 造 系统 的 实时 调度 问题 要 求 优 化 算法 算得 快 ， 能 解 
决 的 问题 规模 大 。 这 就 要 求 优化 方法 能 够 高 效 快 速 地 找到 满意 的 解 ， 至 
于 是 不 是 最 优 解 反 而 并 不 十 分 重要 。 

3. 算法 随时 终止 能 够 随时 得 到 较 好 的 解 

传统 的 优化 方法 不 能 保证 随时 终止 时 能 够 获得 较 好 的 解 ， 比 如 非 线 
性 规划 的 外 点 法 ， 计 算 中 途 终止 算法 连 可 行 解 都 不 能 得 到 。 许 多 实际 问 
题 有 很 高 的 时 效 性 要 求 ， 对 于 这 类 问题 ， 虽 然 计算 更 长 时 间 可 以 获得 更 
好 的 解 ， 但 由 于 急于 使 用 结果 往往 要 求 能 够 随时 终止 计算 ， 并 且 在 终止 
时 能 够 获得 一 个 与 计算 时 间 代价 相当 的 较 好 解 。 

4. 对 优化 模型 中 数据 的 质量 要 求 更 加 宽松 

传统 的 优化 方法 是 基于 精确 数学 的 方法 ， 这 类 方法 对 数据 的 确定 性 
和 准确 性 有 严格 的 要 求 。 实 际 生活 中 很 多 信息 具有 很 高 的 不 确定 性 ， 有 
些 只 能 用 随机 变量 或 模糊 集合 ， 乃 至 语言 变量 来 描述 。 虽 然 传统 的 随机 
规划 或 模糊 优化 方法 有 一 定 的 处 理 数据 不 确定 性 的 能 力 ， 但 这 些 方法 不 
外 乎 是 用 数学 期 望 来 替代 随机 变量 ， 或 是 将 模糊 变量 清晰 化 ， 而 且 计 算 
的 效能 很 低 。 实 际 中 迫切 希望 能 够 直接 对 具有 不 确定 性 的 数据 乃至 语言 
变量 进行 计算 的 优化 方法 。 

实际 生活 中 对 最 优化 方法 性 能 的 需求 促进 了 最 优化 方法 的 发 展 ， 最 
优化 逐步 走出 “象牙 塔 "， 面 向 实际 需要 ， 完 成 了 从 “方法 定向 ”向 
“问题 定向 (Problem Oriented) ”的 转换 。 于 是 新 的 优化 方法 不 断 出 现 。 

1975 年 ，Holland 提出 遗传 算法 (Genetic Algorithms) 。 这 种 优化 方 
法 模仿 生物 种 群 中 优胜 劣 汰 的 选择 机 制 ， 通 过 种 群 中 优势 个 体 的 繁衍 进 
化 来 实现 优化 的 功能 。 

1977 年 ，Glover 提出 禁忌 搜索 (Tabu Search) 算法 。 这 种 方法 将 
记忆 功能 引入 到 最 优 解 的 搜索 过 程 中 ， 通 过 设置 禁忌 区 阻止 搜索 过 程 中 
的 重复 ， 从 而 大 大 提高 了 寻 优 过 程 的 搜索 效率 。 

1983 4, Kirkpatrick 提出 模拟 退火 (Simulated Annealing) 算法 。 
这 种 算法 模拟 热力 学 中 退火 过 程 能 使 金属 原子 达到 能 量 最 低 状 态 的 机 
制 ， 通 过 模拟 的 降温 过 程 按 玻 耳 兹 曼 (Boltzmann) 方程 计算 状态 间 的 
转移 概率 来 引导 搜索 ， 从 而 使 算法 具有 很 好 的 全 局 搜索 能 力 。 

20 世纪 90 年 代 初 ，Dorigo FHA HAE HEAL (Ant Colony Optimiza- 
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tion) 算法 。 这 种 算法 借鉴 蚂蚁 群体 利用 信息 素 相互 传递 信息 来 实现 路 
径 优 化 的 机 理 ， 通 过 记忆 路 径 信息 素 的 变化 来 解决 组 合 优化 问题 。 

1995 年 ，Kennedy 和 Eberhart 提出 粒子 群 优化 ( Particle Swarm 
Optimization) 算法 。 这 种 算法 模仿 鸟 类 和 和 鱼 类 群体 觅 食 迁 徙 中 , 个 体 
与 群体 协调 一 致 的 机 理 ， 通 过 群体 最 优 方 向 、 个 体 最 优 方法 和 惯性 方向 
的 协调 来 求解 实数 优化 问题 。 近 年 来 该 方法 已 经 成 为 新 的 研究 热点 。 

1999 4E, Linhares 提出 捕食 搜索 (Predatory Search) 算法 。 这 种 算 
法 模拟 猛兽 捕食 中 大 范围 搜寻 和 局 部 跟 守 的 特点 ， 通 过 设置 全 局 搜索 和 
局 部 搜索 间 变 换 的 阔 值 来 协调 两 种 不 同 的 搜索 模式 ， 从 而 实现 了 对 全 局 
搜索 能 力 和 局 部 搜索 能 力 的 兼顾 。 

此 外 ， 近 年 来 ， 还 有 模仿 食物 链 中 物种 相互 依存 的 人 工 生命 算法 
( Artificial Life Algorithms) ;模拟 人 类 社会 多 种 文化 间 的 认同 、 排 斥 、 交 
流 和 改变 等 特性 的 文化 算法 〈Cultural Algorithms) 等 一 些 各 具 特 点 但 知 
名 度 不 够 高 的 智能 优化 算法 提出 。 

相对 传统 的 优化 方法 ， 以 上 算法 有 一 些 共同 的 特点 。 

A) 不 以 达到 某 个 最 优 性 条 件 或 找到 理论 上 的 精确 最 优 解 为 目标 ， 
而 是 更 看 重 计算 的 速度 和 效率 。 

(2) 对 目标 函数 和 约束 函数 的 要 求 十 分 宽松 。 

(3) 算法 的 基本 思想 都 是 来 自 对 某 种 自然 规律 的 模仿 ， 具 有 人 工 
智能 的 特点 。 

(4) 多 数 算法 含有 一 个 多 个 体 的 种 群 ， 寻 优 过 程 实 际 上 就 是 种 群 
的 进化 过 程 。 

(5) 这 些 算法 的 理论 工作 相对 比较 薄弱 ， 一 般 说 来 都 不 能 保证 收 
HBT 。 

从 这 些 不 同 的 特点 出 发 ， 这 类 算法 获得 了 各 种 不 同 的 名 称 。 由 于 算 
法 理论 薄弱 ， 它 们 最 早 被 称 为 “现代 启发 式 (Modern Heuristics)” 
“高 级 启发 式 (Advanced Heuristics)”; 从 其 人 工 智能 的 特点 ， 还 被 称 为 
“智能 计算 (Intelligent Computation)” 或 “智能 优化 算法 (Intelligent 
Optimization Algorithms)”; 从 不 以 精确 解 为 目标 的 特点 ， 它 们 又 被 归 到 
“ 软 计算 (Soft Computing) ”方法 中 ; 从 种 群 进化 的 特点 看 ， 它 们 又 可 
以 称 为 “进化 计算 (Evolutionary Computation)”; 从 它们 模仿 自然 规律 
的 特点 出 发 ， 近 几 年 又 有 人 将 它们 称 为 “自然 计算 (Natural Compu- 
ting)”。 当 然 ， 这 些 不 同 的 计算 方法 名 称 各 自 都 还 有 本 身 的 一 些 新 概 
念 ， 限 于 本 书 的 中 心 不 在 于 此 ， 这 里 不 再 展开 讨论 。 

从 应 用 这 些 方法 的 角度 看 ， 以 上 方法 叫 什么 名 称 并 不 重要 ， 重 要 的 


L4 怎样 学 习 研究 智能 优化 方法 T 


是 要 掌握 它们 的 特点 ， 知 其 所 长 ， 也 知 其 所 短 ， 这 样 才能 对 各 类 问题 应 
用 适当 的 方法 。 


1.4 怎样 学 习 研 究 智 能 优化 方法 


智能 优化 方法 是 一 门 计算 科学 。 它 的 理论 工作 相对 比较 薄弱 ， 其 知 
识 点 主要 在 于 介绍 各 种 优化 算法 的 基本 思想 、 计 算 步 骤 和 计算 机 实现 的 
技巧 。 对 于 大 学 理工 科 的 学 生 ， 建 议 在 学 习 研 究 智 能 优化 方法 时 应 该 从 
以 下 几 个 方面 入 手 。 

l. 应 用 智能 优化 算法 解决 各 类 问题 是 重点 

智能 优化 算法 对 各 类 复杂 的 优化 问题 有 很 强 的 适应 性 ， 应 用 这 些 算 
法 解决 一 些 其 他 算法 难以 解决 的 优化 问题 就 成 了 研究 的 重点 。 由 于 以 上 
、 提 到 的 智能 优化 算法 基本 上 都 是 “问题 依赖 〈Problem Dependent)” 
的 ， 即 算法 的 处 理 细节 上 会 因 问题 的 不 同 而 不 同 。 这 样 不 同 的 应 用 问题 
就 需要 具体 情况 具体 处 理 ， 这 就 给 算法 的 研究 带 来 了 很 多 要 解决 的 问 
题 。 比 如 ， 还 没有 人 用 新 算法 解决 过 的 经 典 的 组 合 优化 问题 、 网 络 和 图 
论 中 的 优化 问题 ,还 有 实践 中 的 各 种 各 样 的 应 用 问题 。 近 年 来 杂志 上 发 
表 的 论文 基本 上 都 是 算法 应 用 类 型 的 。 

2. 算法 改进 有 很 大 的 创新 空间 

智能 优化 算法 大 多 给 出 的 只 是 一 个 基本 的 计算 思想 和 步骤 ， 因 此 改 
进 算法 步骤 以 获得 更 好 的 计算 性 能 有 很 大 的 创新 空间 。 比 如 ， 为 遗传 算 
法 设计 新 的 遗传 算 子 ， 为 模拟 退火 设计 新 的 冷却 策略 ， 为 禁忌 搜索 定义 
新 的 邻 域 搜索 ， 等 等 ， 这 些 都 是 可 以 充分 发 挥 读者 聪明 才智 的 地 方 。 

3. 多 种 算法 结合 的 混合 算法 是 一 条 捷径 

由 于 不 同 的 智能 化 算法 各 有 特点 ， 怎 样 将 两 种 乃至 两 种 以 上 的 算法 
结合 起 来 就 一 直 是 不 少 学 者 的 工人 重点。 比如， 遗传 算法 和 禁忌 搜索 的 
混合 算法 ， 禁 尽 搜索 和 模拟 退火 的 混合 算法 ， 等 等 。 当 然 还 有 更 多 的 可 
能 的 混合 方法 还 没有 人 实践 或 者 没有 成 功 ， 这 就 给 后 来 人 留 下 很 多 工作 
的 空间 。 由 于 不 同 算法 的 混合 机 理 是 现存 的 ， 又 容易 引起 同行 们 的 关 
注 ， 获 得 成 果 的 可 能 性 比较 大 ， 所 以 说 这 是 一 条 成 功 的 捷径 。 

4. 不 提倡 刻意 去 追求 理论 成 果 

智能 优化 算法 不 是 一 门 理论 严谨 的 学 科 ， 而 是 一 门 实验 学 科 。 它 没 
有 什么 严格 的 公理 体系 ， 主 要 是 依据 计算 机 计算 得 到 的 性 能 的 好 坏 来 判 
别 算法 的 成 功 与 否 。 虽然 多 种 算法 都 有 一 些 理论 分 析 和 收敛 性 证 明 。 但 
是 从 严谨 数学 的 角度 看 ， 这 些 理论 工作 都 差强人意 ， 有 的 甚至 经 不 起 仔 
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细 推 殴 。 而 且 这 些 理论 工作 对 算法 的 性 能 提高 并 没有 多 少 指导 意义 ， 起 
码 没有 一 个 算法 按 研究 的 收敛 性 条 件 去 制定 算法 停止 准则 。 因 此 ， 建 议 
工科 的 学 生 不 要 刻意 追求 智能 优化 算法 的 理论 成 果 ， 而 要 将 更 多 的 精力 
投入 计算 实践 中 。 当 然 在 计算 实践 中 忽然 有 了 理论 创新 的 灵感 ， 也 不 应 
该 轻易 放 过 。 

5. 算法 性 能 的 测算 是 一 项 要 下 真 功夫 的 工作 

学 习 研 究 智能 优化 算法 就 要 有 坐 在 计算 机 前 反 反复 复 调试 程序 、 计 
算 例题 的 决心 。 无 论 算法 的 改进 、 提 高 还 是 创新 ， 唯 一 的 评价 标准 就 是 
大 量 不 同 规模 例题 的 试 算 结果 的 好 坏 。 虽 然 创 造 性 不 体现 在 例题 测算 
上 ， 但 做 算法 研究 的 人 大 部 分 时 间 都 用 于 例题 测算 。 要 想 在 这 个 领域 里 
获得 成 功 就 必须 喜欢 编程 序 、 喜 欢 在 计算 机 上 工作 ， 并 能 够 从 计算 性 能 
的 意 想不到 的 提高 中 获得 成 功 的 快乐 。 具 有 这 种 潜质 的 学 生 是 从 事 智能 
优化 算法 研究 的 最 佳人 选 。 

6. 选择 测试 例题 的 一 般 规律 

算法 性 能 测试 是 算法 研究 的 基础 工作 ， 那 么 如 何 选 择 测试 例题 则 是 
算法 测试 首先 要 解决 的 问题 。 从 例题 的 说 服 力 出 发 ， 选 择 例题 的 优先 顺 
序 为 : 网 上 题库 中 的 例题 一 文献 中 的 例题 一 随机 产生 的 例题 一 实际 应 用 
问题 一 自己 编 的 例题 。 

对 于 经 典 的 组 合 优化 问题 ， 比 如 旅行 商 问题 (TSP)、 二 次 指派 问 
Hi (QAP) 等 互联 网 上 的 经 典 题库 中 有 很 多 不 同 规模 的 问题 ， 如 果 你 
的 算法 能 够 取得 优 于 文献 中 报道 的 性 能 指标 ， 那 就 是 一 个 了 不 起 的 成 
果 。 对 于 没有 题库 的 问题 ， 如 果 有 文献 计算 过 ， 则 应 该 对 相同 的 问题 来 
计算 比较 。 对 于 新 问题 ， 则 应 该 用 伪 随 机 数 发 生 器 产生 不 同 规模 的 问题 
来 测试 算法 的 计算 性 能 。 再 退 而 求 其 次 就 是 计算 实际 问题 ， 这 使 其 他 同 
行将 很 难 判断 算法 的 好 坏 。 最 没有 说 服 力 的 例题 就 是 自己 编 的 例题 ， 虽 
然 有 不 少 国内 杂志 上 的 论文 就 是 这 样 做 的 ， 但 这 种 做 法 实在 不 值得 
提倡 。 

7. 算法 性 能 测算 的 主要 指标 

算法 性 能 测算 到 底 测算 哪些 指标 ? 一 般 说 来 ， 算 法 性 能 测试 主要 包 
括 以 下 三 个 方面 。 

DM: 即 在 多 次 从 不 同 随机 种 子 出 发 的 计算 中 达到 最 优 解 的 百 
分 比 。 当 找 不 到 问题 的 最 优 解 时 ， 可 以 用 计算 中 获得 的 最 好 解 蔡 代 。 由 
此 派生 出 来 的 指标 还 有 : 解 的 目标 值 平 均值 和 最 优 解 的 目标 值 的 比 、 所 
有 解 的 目标 值 的 标准 差 等 。 

加 计算 速度 : 在 特定 的 软 、 硬 件 环境 中 计算 不 同 规模 问题 的 计算 
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时 间 。 

图 计算 大 规模 问题 的 能 力 : 在 可 接受 时 间 里 能 够 求解 的 最 大 问题 的 
规模 ， 比 如 能 够 在 几 小 时 内 求解 的 TSP 问题 的 城市 数量 。 虽 然 可 解 问 
题 的 规模 依赖 于 计算 速度 ， 但 同时 这 个 指标 还 受 算法 对 计算 机 存储 空间 
需求 量 的 影响 。 占 用 存储 空间 过 大 的 算法 ， 显 然 就 不 能 求解 大 规模 
问题 。 

8. 创造 出 新 算法 是 很 多 人 的 梦想 

学 习 研 究 智能 优化 算法 的 过 程 中 ， 很 多 有 创新 精神 的 人 都 会 自然 想 
到 能 不 能 创造 出 新 的 智能 优化 算法 。 但 是 ， 创 造 新 算法 绝对 不 是 一 件 容 
易 的 事 ， 更 不 是 叫 出 一 个 新 名 词 就 算 成 功 了 。 对 于 一 个 新 算法 ， 要 想 成 
功 必须 达到 以 下 几 点 。 

@D 有 新 的 思想 和 新 的 计算 机 理 。 

四 至 少 对 某 类 问题 的 计算 性 能 优 于 已 有 算法 。 

图 能 在 国际 期 刊 上 发 表 论文 并 被 一 些 同行 引用 。 

图 能 有 其 他 作者 测试 、 改 进 ， 并 应 用 到 其 他 问题 中 。 

近年 来 虽然 有 不 少 作者 提出 一 些 新 算法 ， 比 如 : 鱼 群 算法 、 雁 队 算 
法 、 群 落选 址 算法 等 ， 这 种 精神 值得 鼓励 ， 但 要 真正 成 为 一 种 被 国内 外 
同行 认可 的 算法 还 需要 做 大 量 工作 。 


问题 与 思考 


l. 试 按 传统 优化 算法 的 三 大 步骤 来 分 析 线性 规划 的 单纯 形 法 的 计算 步骤 。 

2. 试 按 传统 优化 算法 的 三 大 步骤 来 分 析 非 线性 规划 的 最 速 下 降 法 的 计算 步骤 。 

3. 试 举 出 一 个 不 能 用 传统 优化 方法 求解 的 实际 问题 来 具体 说 明 传统 优化 算法 
的 局 限 性 。 

4. 试 举 出 一 个 实际 问题 说 明 问 题 对 优化 算法 的 新 的 要 求 ， 特 别 是 本 章 没有 提 
到 的 新 的 要 求 。 

5. 列举 出 本 章 没有 提 到 的 具有 智能 优化 特点 的 其 他 算法 ， 并 说 明 把 它们 归 为 
智能 优化 算法 的 理由 。 
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$23 ” 伪 随 机 数 的 产生 


本 章 首先 介绍 伪 随 机 数 在 智能 优化 算法 中 的 作用 ， 然 后 介绍 最 基本 
的 0 — 1 均匀 分 布 的 伪 随 机 数 的 产生 方法 ， 最 后 介绍 用 0 -1 均匀 分 布 的 
伪 随 机 数 来 构成 正 态 分 布 的 伪 随 机 数 的 方法 ， 以 及 用 逆 变 法 来 产生 其 他 
已 知 概率 密度 函数 的 伪 随机 数 的 方法 。 


2.1 伪 随 机 数 在 智能 优化 方法 中 的 作用 


随机 现象 是 自然 过 程 或 人 工 过 程 中 由 多 种 未 知 因素 共同 作用 产生 的 
一 种 只 可 分 析 其 统计 规律 却 不 能 预测 其 发 生 的 不 确定 现象 。 这 种 现象 表 
现 为 一 系列 没有 规则 的 数值 时 就 成 为 随机 数 。 在 计算 机 仿真 中 人 们 通常 
需要 用 到 随机 数 。 由 于 真正 的 随机 数 不 可 获得 ， 于 是 人 们 通常 用 数字 计 
算 机 按照 某 种 确定 的 规则 ， 通 过 迭代 递 推 运算 来 产生 一 系列 近似 随机 分 
布 的 数列 。 这 样 产生 的 数列 虽然 不 是 由 真实 的 随机 现象 产生 的 ， 但 具有 
类 似 于 随机 数 的 统计 性 质 ， 可 以 作为 随机 数 来 运用 ， 因 此 将 其 称 为 伪 随 
机 数 (Pseudo Random Number) 。 产 生 这 种 伪 随机 数 的 程序 就 称 为 伪 随 
机 数 发 生 器 (Pseudo Random Number Generator， 简 称 RNG) 。 

在 智能 优化 算法 中 ， 几 乎 每 一 种 算法 都 要 用 到 伪 随 机 数 。 比 如 : 

(1) 遗传 算法 : 随机 产生 初始 种 群 ， 用 旋 轮 法 选择 个 体 ， 随 机 选 
择 交 叉 点 ， 随 机 选择 变异 的 基因 。 

(2) 禁忌 搜索 算法 : 随机 选择 初始 解 ， 选 择 多 阶段 禁忌 搜索 的 初 
始 解 。 

(3) 模拟 退火 算法 : 随机 选择 邻 域 解 ， 按 概率 作 转 移 决 策 。 

(4) 蚁 群 算法 : 随机 产生 初始 蚁 群 ， 按 概率 选择 路 径 。 

(5) 粒子 群 优化 算法 : 随机 产生 初始 粒子 群 ， 移 动 方向 的 随机 加 
权 组 合 。 

(6) 捕食 搜索 算法 : 随机 选择 初始 解 ， 在 限制 区 域内 的 随机 搜索 。 

动态 进化 计算 是 这 些 算法 在 动态 环境 下 的 变形 ， 自 然 同样 要 使 用 伪 
随机 数 。 此 外 ， 在 算法 性 能 测试 中 随机 产生 不 同 规模 的 例题 ， 从 不 同 的 
随机 种 子 出 发 来 重复 计算 ， 也 都 要 用 到 伪 随 机 数 。 可 以 说 ， 伪 随机 数 发 
生 器 是 智能 优化 算法 中 使 用 频率 最 高 的 子 程序 。 
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虽然 在 各 种 计算 机 语言 中 大 多 都 有 产生 伪 随 机 数 的 函数 或 子 程序 ， 
但 是 这 些 通用 的 子 程序 有 如 下 一 些 不 足 之 处 : 

(1) 随机 序列 的 长 度 和 随机 数 的 字 长 通常 不 如 自 编程 序 来 得 更 好 。 

(2) 在 重复 计算 中 ,不 如 自 编 的 程序 容易 控制 。 

(3) 除了 正 态 分 布 之 外 ， 一 般 没 有 产生 其 他 分 布 函数 的 伪 随 机 数 
的 子 程序 。 

鉴于 以 上 这 些 原因 ， 自 己 按照 伪 随机 数 产生 的 方法 来 自 编 伪 随 
机 数 发 生 器 子 程序 是 十 分 必要 的 。 同 时 从 学 习 的 观点 看 ， 也 只 有 掌握 
了 计算 机 产生 伪 随 机 数 的 原理 和 方法 ， 才 能 在 实际 中 得 心 应 手 地 
使 用 。 


2.2 产生 0 -1 均匀 分 布 伪 随机 数 的 乘 同 余 法 


0 -1 均匀 分 布 的 伪 随 机 数 是 最 基本 也 是 最 简单 的 伪 随 机 数 ， 它 是 
生成 一 切 其 他 分 布 的 伪 随 机 数 的 基础 ， 同 时 也 是 智能 优化 算法 中 应 用 最 
广 的 伪 随 机 数 。 

dk X 0 -1 均匀 分 布 的 随机 变量 ,x 是 X 的 一 个 取 值 ， 即 一 个 均 
匀 分 布 的 伪 随 机 数 ， 记 为 xse U(0，1)。 其 中 ,UV 表示 均匀 分 布 , 0, 1 
表示 分 布 的 区 间 。XX 的 密度 函数 为 
n 0<x<1 


2.1 
o, 其 他 vM 


f(x) = 
其 分 布 函数 为 
0, x«0 
ro 0<x<1 (2.2) 


1, xzl 


密度 函数 /(x) 和 分 布 函 数 F(x) 如 图 2.1 所 示 。 


fe FQ) 


* 


图 2.1 0-1 均匀 分 布 的 密度 函数 与 分 布 函数 
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可 以 容易 地 推出 ，V(0，1) 的 数学 期 望 和 标准 差 o 分 别 为 
may ary; (2.3) 
0 -1 均匀 分 布 的 伪 随 机 数 通常 是 由 均匀 分 布 的 伪 随 机 整数 除 以 数 
列 长 度 获得 的 ， 所 以 首先 要 讨论 产生 均匀 随机 数 的 方法 。 判 断 一 个 产生 
方法 好 坏 的 标准 主要 有 以 下 几 点 : 
(1) 产生 的 数列 具有 很 好 的 随机 性 和 均匀 性 。 
(2) 不 出 现 重复 的 数列 的 长 度 要 尽 可 能 长 。 
(3) 产生 伪 随 机 数 的 计算 速度 要 快 。 
(4) 计算 程序 占用 的 计算 机 内 存 要 尽 可 能 少 。 
产生 均匀 随机 数 的 方法 主要 有 : 
(1) 平方 取 中 法 : 将 一 个 2n 位 的 二 进 制 随机 数 自 乘 后 ， 取 中 间 的 
2n 位 作为 新 的 随机 数 。 其 公式 为 
Bi, = (By Bilan (2.4) 
其 中 ，B, 表 示 第 次 迭代 得 到 的 二 进 制 随机 数 ，[， ]2, 表 示 取 中 间 2n 
位 数字 。 
(2) 倍 积 取 中 法 : 用 一 个 整数 常数 4 来 乘 一 个 ”位 的 随机 数 ， 取 
中 间 n 位 作为 新 的 随机 数 。 其 公式 为 
Sia =[4,5], (2.5) 
其 中 ，5, 表 示 第 次 迭代 得 到 的 随机 数 ，[。 ] ,表示 取 中 间 n 位 数字 。 
G) RARE: 乘 同 余 法 是 最 广泛 使 用 的 产生 随机 数 的 方法 ， 也 
是 本 节 讨论 的 重点 。 其 基本 思想 是 : 用 一 个 整数 常数 4 来 乘 一 个 随机 
数 ， 将 得 到 的 积 除 以 模 M 的 余数 作为 新 的 随机 数 。 乘 同 余 法 用 公式 表 
达 如 下 : 
WE A 是 一 个 整数 常数 ，M 是 一 个 大 的 模 数 ， 则 
S,.ı =AS,mod(M) (2.6) 
其 中 ，5, 表 示 第 k 次 迭代 得 到 的 随机 数 ; mod(* ) 表示 取 模 运算 ， 即 
取 除 以 模 的 余数 的 运算 。 
在 伪 随 机 数 的 运用 中 ， 总 是 希望 产生 不 重复 的 随机 数 序列 的 长 度 越 
长 越 好 。 
根据 数论 的 理论 可 以 证 明 : 位 数 为 了 的 计算 机 ， 如 果 取 模 数 M = 
24， 当 CD4 =8k 43, A=4k+1, k HEG OS, 为 奇数 时 ， 可 以 获得 
最 长 的 随机 数 序列 长 度 为 2 *。 
例 2.1 车 L 为 6, 则 M=64, 取 4=13，5。=1; 那么 可 以 获得 一 
个 随机 数 序 列 : 
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{1, 13, 41, 21, 17, 29, 57, 37, 33, 45, 9, 53, 49, 61, 25 
5; ) exl 
以 上 不 重复 的 序列 长 度 为 2” = 16， 其 分 布 见 表 2. 1。 
表 2.1 一 个 随机 数 序列 的 分 布 举例 
<10 | 10-20 | 20-30 | 30-40 | so-so | so-so | >60 


34 2^ 3^ 2 个 3^ 2^ it 


可 见 以 上 产生 的 随机 数 均匀 分 布 在 区 间 [1, M] 内 。 

(4) 混合 同 余 法 : 混合 同 余 法 也 称 为 线性 同 余 法 ， 它 能 够 在 同等 
的 计算 机 上 产生 比 乘 同 余 法 更 长 的 均匀 分 布 的 随机 数 序列 。 其 基本 思想 
E: 用 一 个 整数 常数 4 乘 一 个 随机 数 再 加 上 一 个 整数 常数 C， 将 得 到 的 
结果 除 以 模 M. 的 余数 作为 新 的 随机 数 。 混 合同 余 法 用 公式 表达 如 下 

8,,, = (AS, +C)mod(M) (2.7) 

显然 ， 当 C =0 时 ， 混 合同 余 法 即 退 化 为 乘 同 余 法 。 

根据 数论 的 理论 可 以 证 明 : 位 数 为 工 的 计算 机 ， 如 果 取 模 数 M = 
2^, «(DA =4k +1, k HESH; QC 与 M 互 为 质数 时 ， 可 以 获得 最 长 
的 随机 数 序列 长 度 为 2 。 

例 2.2 FLAS, 则 MM=32, 取 4=13, C=5; (IR S =1, BA 
可 以 获得 一 个 随机 数 序列 : 

{1, 18, 15, 8, 13, 14, 27, 4, 25, 10, 7, 0, 5, 6, 19, 28, 
17, 2, 31, 24, 29, 30, 11, 20, 9, 26, 23, 16, 21, 22, 3, 12, 
1, +} 
以 上 随机 数 序列 的 不 重复 的 长 度 为 32。 

虽然 混合 同 余 法 比 乘 同 余 法 要 多 做 一 次 加 法 ,但 在 相同 计算 机 上 产 
生 的 随机 数 的 长 度 是 乘 同 余 法 的 4 倍 。 在 对 随机 数 的 长 度 有 较 高 要 求 
时 ， 应 考虑 采用 混合 同 余 法 。 

一 旦 获得 随机 数 S,，0 -1 均匀 分 布 的 随机 数 就 可 以 用 除 以 模 获 得 ， 
公式 如 下 : 


x, 2 $/M (2.8) 
z; 即 为 0 - 1 均匀 分 布 的 随机 数 。 
[a, b] 之 间 的 均匀 分 布 则 可 以 由 以 下 公式 获得 : 
y, =a *(b-a)x, (2.9) 
yi BDA [a, b) 之 间 的 均匀 分 布 的 随机 数 ， 记 为 ms U(a, b). 
在 智能 优化 算法 中 经 常 要 产生 1 和 n 之 间 的 整数 K， 这 也 可 以 方便 
地 由 0 -1 均匀 分 布 的 随机 数 产 生 。 公 式 如 下 : 
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K=1+Int[xn], xe U(0, 1) (2.10) 
其 中 ，Int (2] 为 取 整 运算 ， 即 取 小 于 = 的 最 大 整数 。 


2.3 产生 正 态 分 布 伪 随 机 数 的 方法 


正 态 分 布 又 称 高 斯 分 布 ， 是 最 常见 的 随机 分 布 ， 在 智能 优化 方法 中 
也 常用 到 。 

车 了 服从 参数 为 Mo 的 正 态 分 布 ， 即 为 : X-N(u, °) Rze 
N(n, o^), P, uo 分别 为 X 的 期 望 值 和 标准 差 。 当 4 =0 Alo = 
1 时 ， 称 为 0 -1 正 态 分 布 ， 即 N(0，1) 。 其 密度 函数 和 分 布 函数 分 别 
为 

1 


E -£ 2.11 
ID (2.11) 
Al 
1 4 
Fo) «E. (2.12) 


0 - 1 正 态 分 布 的 密度 函数 和 分 布 函数 如 图 2. 2 所 示 。 


fe) 


x 


0 


图 2.2 0-1 正 态 分 布 的 密度 函数 与 分 布 函数 
由 于 其 他 正 态 分 布 都 可 以 用 NCO, 1) ÆR, ZERE NO, 1) 
的 生成 方法 。 
由 概率 理论 知道 ， 若 7 ，Y,，…，Y, 是 n 个 独立 同 分 布 的 随机 变 
量 ， 当 = 足够 大 时 
X=Y, +Y, + +Y, (2:13) 
就 近似 于 一 个 正 态 分 布 。 一 般 说 来 ， 当 m>6 时 ，X 就 是 一 个 正 态 分 布 
的 很 好 的 近似 。X 的 均值 和 方差 分 别 为 
My = Hy + + (2.14) 
和 


0. -0,*0)*77 +0, =n0° (2.15) 
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FHA X~N(mp, no^) BxeN (mp, n°), HHHH NO, 1), 


* 


(2.16) 


MW, zeN(0, 1). 
将 (2.12) 写成 随机 变量 的 样本 形式 , 并 将 式 (2.13) MR 
(2.14) RAR (2.15), 48 


zm ————— (2.17) 


4ng 
可 以 取 y，i=1，2，…，nm， 为 独立 的 同 为 0 -1 均匀 分 布 随机 变量 的 
样本 ， 则 由 公式 (2.3)， 得 到 了 确定 的 人 和 o 的 值 。 代 入 式 (2.16) 
得 到 


(xs (2.18) 
为 计算 方便 ， 取 ”= 12， 即 产生 12 个 0 -1 均匀 分 布 的 伪 随 机 数 
y,eU(0, 1), i=1, 2, =, 12, FÆR (2.17) 简化 为 
z=) ¥,-6 (2.19) 
这 样 就 可 以 方便 地 得 到 服从 0 - 1 正 态 分 布 的 随机 数 , ze N(0，1)。 
如 果 需 要 产生 服从 一 般 正 态 分 布 N(4，o"*) 的 随机 数 * 时， 只 要 
首先 按 式 (2.18) 产生 zeN(0，1) ， 再 按 公式 
x=ptoz (2.20) 
变化 ， 就 可 以 获得 所 需要 的 伪 随 机 数 。 


2.4 产生 其 他 分 布 的 伪 随 机 数 的 逆 变 法 


除了 均匀 分 布 和 正 态 分 布 之 外 ， 在 智能 优化 算法 中 还 可 能 用 到 其 他 
分 布 函数 的 伪 随 机 数 ， 本 节 讨 论 产 生 其 他 已 知 分 布 函数 的 随机 数 的 逆 
变法 。 
设 大 是 一 个 已 知 分 布 函数 为 F(x*) 的 随机 变量 ,目的 是 要 产生 
取 值 的 随机 数 序列 [x], Y=F(X) &— T XT XW, HA X WA 
布 函数 FC) ARAM, MEX HAEE x, y = Fx) 
也 是 了 的 一 个 样本 值 。 设 严 …( WN FC +) 逆 函 数 ， 则 有 
X-F'(Y)füxszF^(y) (2.21) 
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那么 按照 分 布 函数 的 定义 ， 了 的 分 布 函数 为 
P(Y«y) =P(F(X) «y) =P(X «F^ ()) 
=P(X <x) =F(2) =y 

如 果 了 的 定义 域 在 (0, 1] K, HRA (2.2) 表达 的 U(0, 1) 
的 分 布 函数 ， 可 知 了 服从 0 -1 均匀 分 布 。 即 Y~U(0, 1), Rye VCO, 
1)。 

由 以 上 推导 可 知 ， 只 要 产生 一 个 ye U(0，1), 按照 式 (2.20), 
就 可 以 用 分 布 函 数 的 逆 函 数 '(. ) 产生 分 布 函 数 为 F(， ) 的 随 
机 数 。 

有 时 候 给 出 的 是 要 求 产 生 的 随机 变量 的 密度 函数 f(x) ， 这 时 就 必 
须 先 用 


(2.22) 


FG) = f. fo (2.23) 


求 出 分 布 函数 F(x*) 。 

逆 变 法 的 计算 步骤 如 下 : 

步骤 1: 按 式 (2.22), ， 由 给 定 的 密度 函数 (C). 计算 分 布 函数 
F(x), RABA F(x). 

步 又 2: 推导 F(x) WARK F O) o 

步骤 3: 产生 0 -1 均匀 分 布 的 随机 数 , ye 0(0，1)。 

步骤 4: BRF (y). 计算 得 到 XX 的 一 个 样本 值 。 

EMS: 重复 步骤 3 至 步骤 4， 即 得 到 一 个 分 布 为 F(x) 的 随机 数 
序列 {x,1。 

递 变法 为 产生 其 他 已 知 分 布 的 随机 数 提供 了 一 种 十 分 有 效 的 方法 。 
下 面 讨论 两 个 逆 变 法 应 用 的 例子 。 

例 2.3 产生 负 指 数 分 布 的 随机 数 xo 

已 知 负 指 数 分 布 的 密度 函数 为 : f(x) = Ae“, (x20), H K 
数 由 下 式 推导 : 


F(x) = fecta =1-e*,x>0 
令 y=1-e-*， 则 求 其 着 函数 得 到 :zx = -1m0 -y).H Ty 


是 0 -1 均匀 分 布 时 ,zx =1 -y 也 是 0 -1 均匀 分 布 的 。 所 以 , 产生 
ueU(0, 1), ÈR 


xz -lnu 
A 


就 可 获得 负 指 数 分 布 的 随机 数 *。 
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例 2.4 试用 逆 变 法 设计 分 布 如 图 2. 3 所 示 的 密度 函数 f(x) 的 伪 
随机 数 序列 的 产生 方法 。 
解 : 由 图 2.3 RID, 已 知 密度 函数 为 


fG)-1-$, O<x<2 


fe 
1 


0 3 


图 2.3 逆 变 法 举例 的 密度 函数 
推导 得 到 其 分 布 函 数 为 


F(x) = Le EL - [|-4], =:-Ż 
o 
yii. 解 之 得 到 : x, 2242 /1-y Hx, 22-2 V1 - y. H 


于 第 一 个 根 不 在 定义 域 [0, 2) ZA, HE Sual-y, 产生 
ueU(0，1)， 按 式 


x22-24u 
即 可 获得 所 需要 分 布 的 伪 随 机 数 。 


问题 与 思考 


1. 分 别 按 以 下 4 组 参数 用 乘 同 余 法 产生 10 个 伪 随 机 数 ，* ，z，… ,xio， 
指出 哪 组 参数 设置 是 正确 的 ， 说 明 不 能 正确 产生 伪 随 机 数 的 参数 组 的 问题 出 在 
何 处 。 

(1) M=64, 4=11，x =1; (2) M=64, 4=20, x =1; (3) M=60, A=11, 
x 71; (4) M=64, A=11, x, 72, 

2. 分 别 按 以 下 3 组 参数 用 混合 同 余 法 产生 10 TRL, r, r s tos 
指出 哪 组 参数 设置 是 正确 的 ， 说 明 不 能 正确 产生 伪 随 机 数 的 参数 组 的 问题 出 在 
何 处 。 

(1) M=64, A=13, C=7, x =1; (2) M =64, A=20, C27, x =1; 
(3) M=64, A=13, C=8, x 71, 

3. 试用 逆 变 法 设计 出 如 图 2.4 所 示 的 密度 函数 fx) 的 伪 随 机 数 序列 的 产生 
方法 。 
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图 2.4 题 3 图 

4. 试 设计 出 几何 分 布 的 伪 随 机 数 的 产生 方法 。 其 密度 函数 和 分 布 函数 分 别 为 
f(x =k) =p", p+q=l, k=1, 2, 4 F(x) =1 -q'o 

5. 除了 本 书 介绍 的 方法 之 外 ， 试 举 出 其 他 产生 均匀 伪 随 机 数 的 方法 ， 并 分 析 
不 同方 法 的 优 缺点 。 

6. 除了 本 书 介绍 的 方法 外 ， 试 举 出 其 他 产生 已 知 密度 函数 或 分 布 函数 的 随机 
数 的 方法 ， 并 分 析 不 同方 法 的 优 缺 点 。 

7. 对 于 乘 同 余 法 ， 你 能 否 想 出 更 好 的 参数 配置 方案 ， 从 而 获得 更 长 的 不 重复 
的 随机 数 序列 长 度 。 
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PIF 遗传 算法 


遗传 算法 是 智能 优化 方法 中 应 用 最 为 广泛 也 最 为 成 功 的 算法 。 本 章 
首先 从 介绍 遗传 算法 的 产生 发 展 与 基本 原理 开始 ， 然 后 讨论 遗传 算法 的 
基本 构成 和 模板 理论 ， 介 绍 由 不 同 编码 方式 、 选 择 压力 的 调整 、 不 同 标 
定 方法 等 带 来 的 各 种 变形 算法 。 最 后 介绍 几 个 典型 应 用 的 例子 。 


3.1 导 言 


遗传 算法 (Genetic Algorithms， 简 称 GA 或 GAs) 是 由 美国 密歇根 
大 学 的 John H. Holland 教授 及 其 学 生 于 20 世纪 60 年 代 末 到 70 年 代 初 
提出 的 。 在 1975 年 出 版 的 《自然 与 人 工 系统 的 自 适应 性 》 (Adaptation 
in Natural and Artificial Systems) 一 书 中 ，Holland % 4¢ Hh BW YR T WAEA 
法 的 基本 理论 和 方法 ， 提 出 了 对 遗传 算法 的 理论 发 展 极为 重要 的 模板 理 
论 (Schema Theory)。 

后 来 De Jong 和 Goldberg 等 人 做 了 大 量 的 工作 ， 使 遗传 算法 更 加 完 
善 。 近 年 来 ， 由 于 遗传 算法 求解 复杂 优化 问题 的 巨大 潜力 及 其 在 工业 工 
程 、 人 工 智 能 、 生 物 工程 、 自 动 控制 等 各 个 领域 的 成 功 应 用 ， 该 算法 得 
到 了 广泛 的 关注 。 可 以 说 ， 遗 传 算法 是 目前 为 止 应 用 最 为 广泛 和 最 为 成 
功 的 智能 优化 方法 。 

生物 在 自然 界 中 的 生存 繁衍 ， 显 示 了 其 对 自然 环境 的 优异 的 自 适应 
能 力 。 遗 传 算法 所 借鉴 的 生物 学 基础 就 是 生物 的 进化 和 遗传 。 


3.1.1 生物 的 进化 


生物 在 其 延续 生存 的 过 程 中 ， 逐 渐 适应 其 生存 环境 ， 使 得 其 品质 不 
断 得 到 改良 ， 这 种 生命 现象 称 为 进化 〈Evolution)。 生 物 的 进化 是 以 集 
团 的 形式 共同 进行 的 ， 这 样 的 一 个 团体 称 为 群体 (Population) ， 组 成 群 
体 的 单个 生物 称 为 个 体 (Individual) ， 每 个 个 体 对 其 生存 环境 都 有 不 同 
的 适应 能 力 ， 这 种 适应 能 力 称 为 个 体 的 适应 度 ( Fitness) 。 按 照 达尔 文 
的 进化 论 ， 那 些 具有 较 强 适应 环境 变化 能 力 的 生物 个 体 具有 更 高 的 生存 
能 力 ， 容 易 存活 下 来 ， 并 有 较 多 的 机 会 产生 后 代 ; 相反 ,具有 较 低 生存 
能 力 的 个 体 则 被 淘汰 ， 或 者 产生 后 代 的 机 会 越 来 越 少 ， 直 至 消亡 。 达 尔 
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文 把 这 一 过 程 和 现象 叫做 “自然 选择 ， 适 者 生存 "。 通 过 这 种 自然 的 选 
择 ， 物 种 将 逐渐 地 向 适应 于 生存 环境 的 方向 进化 ， 从 而 产生 优良 的 
物种 。 


3.1.2. 生物 的 遗传 和 变异 


生物 从 其 亲 代 继承 特性 或 性 状 ， 这 种 生命 现象 就 称 为 遗传 (Heredity), 
研究 这 种 生命 现象 就 称 为 遗传 学 〈Genetics) 。 由 于 遗传 的 作用 ， 使 得 人 们 
可 以 种 瓜 得 瓜 、 种 豆 得 豆 ， 也 使 得 鸟 仍 然 在 天 空中 飞翔 ， 鱼 仍然 在 水 中 
邀 游 。 构 成 生物 的 基本 结构 和 功能 单位 是 细胞 (Cell) 。 细 胞 中 含有 一 
种 微小 的 丝 状 化 合 物 ， 称 为 染色 体 (Chromosome) ， 生 物 的 所 有 遗传 信 
息 都 包含 在 这 个 复杂 而 又 微小 的 染色 体 中 。 染 色 体 主要 由 蛋白 质 和 脱氧 
核糖 核酸 (DNA) 组 成 。 控 制 生物 遗 传 的 物质 单元 称 为 基因 (Gene), 
它 是 有 遗传 效应 的 DNA 片段 。 生 物 的 各 种 性 状 由 其 相应 的 基因 所 控制 。 

细胞 在 分 裂 时 ， 遗 传 物质 DNA 通过 复制 (Reproduction) 而 转移 到 
新 产生 的 细胞 中 ， 新 细胞 就 继承 了 旧 细 胞 的 基因 。 有 性 生物 在 繁殖 下 一 
代 时 ， 两 个 同 源 染 色 体 之 间 通 过 交叉 (Crossover) 而 重组 ， 即 两 个 染色 
体 的 某 一 相同 位 置 处 的 DNA 被 切断 ， 其 前 后 两 串 分 别 交叉 组 合 而 形成 
两 个 相同 的 染色 体 。 另 外 ， 在 进行 复制 时 ， 可 能 以 很 小 的 概率 产生 某 些 
差错 ， 从 而 使 DNA 发 生 某 种 变异 ( Mutation) ， 产 生出 新 的 染色 体 。 

生物 进化 的 本 质 体现 在 染色 体 的 改变 和 改进 上 ， 生 物体 自身 形态 和 
对 环境 适应 能 力 的 变化 是 染色 体 结构 变化 的 表现 形式 。 自 然 界 的 生物 进 
化 是 一 个 不 断 循环 的 过 程 。 在 这 一 过 程 中 ， 生 物 群 体 也 就 不 断 地 完善 和 
发 展 。 可 见 ， 生 物 进 化 过 程 本 质 上 是 一 种 优化 过 程 ， 在 计算 科学 上 具有 
直接 的 借鉴 意义 。 


3.2. 遗传 算法 的 基本 原理 


3.2.1 基本 思想 


遗传 算法 是 根据 问题 的 目标 函数 构造 一 个 适 值 函数 (Fitness Func- 
tion) ， 对 一 个 由 多 个 解 〈 每 个 解 对 应 一 个 染色 体 ) 构成 的 种 群 进行 评 
估 、 遗 传 运算 、 选 择 ， 经 多 代 繁 殖 ， 获 得 适应 值 最 好 的 个 体 作为 问题 的 
最 优 解 。 具 体 可 以 描述 如 下 。 

1. 产生 一 个 初始 种 群 

遗传 算法 是 一 种 基于 群体 寻 优 的 方法 ， 算 法 运行 时 是 以 一 个 种 群 在 
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搜索 空间 进行 搜索 。 一 般 是 采用 随机 方法 产生 一 个 初始 种 群 。 也 可 以 使 
用 其 他 方法 构造 一 个 初始 种 群 。 

2. 根据 问题 的 目标 函数 构造 适 值 函 数 ( Fitness Function) 

在 遗传 算法 中 使 用 适 值 函数 来 表征 种 群 中 每 个 个 体 对 其 生存 环境 的 
适应 能 力 ， 每 个 个 体 具 有 一 个 适应 值 (Fitness Value)。 适 应 值 是 群体 
中 个 体 生存 机 会 的 唯一 确定 性 指标 。 适 值 函数 的 形式 直接 决定 着 群体 的 
进化 行为 。 适 值 函 数 基本 上 依据 优化 的 目标 函数 来 确定 。 为 了 能 够 直接 
将 适 值 函数 与 群体 中 的 个 体 优 劣 相 联 系 ， 在 遗传 算法 中 适应 值 规定 为 非 
负 ， 并 且 在 任何 情况 下 总 是 希望 越 大 越 好 。 

3. 根据 适应 值 的 好 坏 不 断 选 择 和 繁殖 

在 遗传 算法 中 自然 选择 规律 的 体现 就 是 以 适应 值 的 大 小 决定 的 概率 
分 布 来 进行 选择 。 个 体 的 适应 值 越 大 ， 该 个 体 被 遗传 到 下 一 代 的 概率 越 
Xi BRE, 个 体 的 适应 值 越 小 ， 该 个 体 被 遗传 到 下 一 代 的 概率 也 越 小 。 
被 选择 的 个 体 两 两 进行 繁殖 。 繁 殖 产 生 的 个 体 组 成 新 的 种 群 。 这 样 的 选 
择 和 繁殖 的 过 程 不 断 重复 。 

4. 若干 代 后 得 到 适应 值 最 好 的 个 体 即 为 最 优 解 

在 若干 代 后 ， 得 到 的 适应 值 最 好 的 个 体 所 对 应 的 解 即 被 认为 是 问题 
的 最 优 解 。 


3.2.2 构成 要 素 


这 里 将 遗传 算法 的 构成 要 素 简要 说 明 如 下 ， 其 具体 的 技术 实现 细节 
将 在 后 面 详细 进行 讨论 。 

1. 种 群 和 种 群 大 小 

种 群 是 由 染色 体 构成 的 。 每 个 个 体 就 是 一 个 是 染色 体 ， 每 个 染色 体 
对 应 着 问题 的 一 个 解 。 种 群 中 个 体 的 数量 称 为 种 群 大 小 或 者 种 群 规 模 
(Population Size, Pop - Size) ， 后 文中 将 用 NP 来 表示 。 种 群 规模 通常 
是 采用 一 个 不 变 的 常数 。 一 般 来 说 ， 遗 传 算法 中 种 群 规模 越 大 越 好 ， 但 
是 种 群 规模 的 增 大 也 将 导致 运算 时 间 的 增 大 ， 一 般 设 为 100 ~1 000。 在 
一 些 特殊 情况 下 ， 群 体 规模 也 可 能 采用 与 遗传 代数 相关 的 变量 ， 以 获取 
更 好 的 优化 效果 。 

2. 编码 方法 (Encoding Scheme) 

编码 方法 也 称 为 基因 表达 方法 (Gene Representation) 。 在 遗传 算法 
中 ,种群 中 的 每 个 个 体 ， 即 染色 体 是 由 基因 构成 的 。 所 以 染色 体 与 要 优 
化 的 问题 的 解 如 何 进行 对 应 ， 就 需要 通过 基因 来 进行 表示 ， 即 对 染色 体 
进行 正确 的 编码 。 正 确 地 对 染色 体 进行 编码 来 表示 问题 的 解 是 遗传 算法 
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的 基础 工作 ， 也 是 最 重要 的 工作 。 

3. 遗传 算 子 (Genetic Operator) 

遗传 算 子 包括 交叉 (Crossover) 和 变异 (Mutation) ) 。 遗 传 算 子 模 
拟 了 每 一 代 中 创造 后 代 的 繁殖 过 程 ， 是 遗传 算法 的 精 血 。 

交叉 是 最 重要 的 遗传 算 子 ， 它 同时 对 两 个 染色 体 进行 操作 ， 组 合 二 
者 的 特性 产生 新 的 后 代 。 交 叉 的 最 简单 方式 是 在 双亲 的 染色 体 上 随机 
地 选择 一 个 断 点 ， 将 断 点 的 右 段 互相 交换 ， 从 而 形成 两 个 新 的 后 代 。 
这 种 方法 对 于 二 进 制 编 码 最 合适 。 遗 传 算法 的 性 能 在 很 大 程度 上 取决 
于 采用 的 交叉 运算 的 性 能 。 双 亲 的 染色 体 是 否 进行 交叉 由 交叉 率 来 进 
行 控制 。 

交叉 率 ( 记 为 P.) 定义 为 各 代 中 交叉 产生 的 后 代数 与 种 群 中 的 个 
体 数 的 比 。 显 然 ， 较 高 的 交叉 率 将 达到 更 大 的 解 空间 ， 从 而 减 小 停止 在 
非 最 优 解 上 的 机 会 ;但 是 交叉 率 太 高 ， 会 因 过 多 搜索 不 必要 的 解 空间 而 
耗费 大 量 的 计算 时 间 。 

变异 是 在 染色 体 上 自发 地 产生 随机 的 变化 。 一 种 简单 的 变异 方式 是 
替换 一 个 或 者 多 个 基因 。 在 遗传 算法 中 ， 变 异 可 以 提供 初始 种 群 中 不 含 
有 的 基因 ， 或 者 找到 选择 过 程 中 丢失 的 基因 ， 为 种 群 提供 新 的 内 容 。 染 
色 体 是 否 进行 变异 由 变异 率 来 进行 控制 。 

ERR GTH Pa) 定义 为 种 群 中 变异 基因 数 在 总 基因 数 中 的 百 分 
比 。 变 异 率 控制 着 新 基因 导入 种 群 的 比例 。 若 变异 率 太 低 ， 一 些 有 用 的 
基因 就 难以 进 信 选择 ; 若 太 高 ， 即 随机 的 变化 太 多 ， 那 么 后 代 就 可 能 失 
去 从 双亲 继承 下 来 的 好 特性 ， 这 样 算法 就 会 失去 从 过 去 的 搜索 中 学 习 的 
能 力 。 

4. 选择 策略 

选择 策略 是 从 当前 种 群 中 选择 适应 值 高 的 个 体 以 生成 交配 池 的 过 
程 。 使 用 最 多 的 是 正比 选择 策略 。 选 择 过 程 体现 了 生物 进化 过 程 中 
“ 适 者 生存 ， 优 胜 劣 汰 ”的 思想 ， 并 保证 优良 基因 遗传 给 下 一 代 个 
体 。 

5. 停止 准则 (Stopping Rule/Criterion) 

一 般 使 用 最 大 迭代 次 数 作为 停止 准则 。 


3.2.3 算法 流程 


下 面 将 以 Holland 的 基本 GA 为 例 说 明 算 法 的 具体 实现 。Holland 的 
基本 GA 流程 图 如 图 3.1 所 示 。 
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图 3.1 遗传 算法 流程 图 

由 图 3.1 可 以 看 到 遗传 算法 实现 中 的 各 个 步骤 包括 : (1) 初始 种 
群 的 产生 ，(2) 编码 方法 ; (3) 适 值 函数 ;(4) 遗传 运算 ，(5) 选择 
策略 ; (6) 停止 准则 。 下 面 就 对 各 个 步骤 的 实现 进行 具体 说 明 。 

1. 初始 种 群 的 产生 í 

初始 种 群 是 随机 产生 的 ， 具 体 的 产生 方式 依赖 于 编码 方法 。 种 群 的 
大 小 依赖 于 计算 机 的 计算 能 力 和 计算 复杂 度 。 例 如 ，0 -1 编码 的 具体 
产生 方式 如 下 : 

随机 产生 &,eU(0, 1), 3$ 6,20.5, Mx, =1 

车 &,<0.5, W x, -0 


2. 编码 方法 一 一 二 进 制 编码 
每 个 染色 体 可 以 表示 为 
X= («,,%,,°7,4,),1<isn 


染色 体 的 每 一 位 ， 即 *; 是 一 个 基因 。 每 一 位 的 取 值 称 为 位 值 。n 称 
为 染色 体 的 长 度 。Holland 的 基本 GA 使 用 二 进 制 编码 ， 即 使 用 固定 长 
ERO, 1 字符 串 表示 一 个 染色 体 ， 例 如 

X - (0110010) 
就 可 以 表示 一 个 染色 体 ， 该 个 体 的 染色 体 长 度 为 n=7。 

二 进 制 编码 适用 于 以 下 三 种 情况 。 
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(1) 背包 问题 
个 物品 ， 对 物品 i， 价 值 为 p:， 质 量 为 w ， 背 包容 量 为 W。 如 何 
选取 物品 装 入 背包 ,使 背包 中 的 物品 的 总 价值 最 大 。 
其 编码 如 下 所 示 : 
_ pl, 装 入 物品 i 
= 和 amm: 
(2) 实 优化 问题 
当 精 度 要 求 高 时 编码 长 ， 一 般 不 采用 此 编码 方法 ， 而 采用 实数 纺 
码 。 
(3) 指派 问题 
指派 问题 是 一 类 特殊 的 线性 规划 问题 ， 其 中 工作 对 资源 的 需求 是 一 
对 一 的 。 每 样 资源 (如 雇员 、 机 器 、 时 间 段 ) 唯一 地 指派 给 一 件 工作 
(如 任务 、 位 置 、 事 件 ) 。 资 源 ii=1，2，…，n) 指派 给 工作 j(j = 1， 
2, o, n) 产生 一 个 相应 费用 c,， 问 题 的 目标 是 如 何 指派 可 使 总 费用 
达到 最 小 。 
用 0，1 编码 的 变量 *, 来 表达 资源 与 工作 的 关系 如 下 : 
_ /1, 资源 i 指派 给 工作 j 
T: 其 他 
二 进 制 编码 缺点 : 编码 长 不 利于 计算 。 
二 进 制 编码 优点 : 便于 位 值 计算 ， 包 括 的 实数 范围 大 。 
3. 适 值 函数 
前 面 已 经 说 明 ， 适 值 函数 一 般 根据 目标 函数 来 进行 设计 。 目 标 函数 
一 般 表 示 为 Kxz) ， 适 值 函 数 一 般 表示 为 F(x) 。 从 目标 函数 (2) 映射 
到 适 值 函数 F(x) 的 过 程 称 为 标定 〈Scaling) 。 采 用 方法 介绍 如 下 。 
对 于 求 目标 函数 最 小 值 的 优化 问题 ， 理 论 上 只 需 简单 加 一 个 负 号 就 
可 以 将 其 转化 为 求 目标 函数 最 大 值 的 优化 问题 ， 即 
F(x) = - minf(x) 
对 于 求 目 标 函 数 最 大 值 的 优化 问题 ， 当 目标 函数 总 为 正 值 时 ， 可 以 
直接 设 定 其 适 值 函数 就 等 于 目标 函数 ， 即 
F(x) 2 maxf(x) 
4. 遗传 运算 
遗传 运算 ， 即 交叉 和 变异 ， 是 遗传 算法 的 精髓 ， 也 是 变化 最 多 的 地 
方 。 下 面 就 来 介绍 交叉 和 变异 的 具体 实现 。 
(1) 交叉 
交叉 操作 中 ， 使 用 最 多 的 是 单 点 交叉 和 双 点 交叉 。 
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ORM RR 

单 切 点 交叉 是 由 Holland 提出 的 最 基础 的 一 种 交叉 方式 。 从 种 群 中 
选 出 两 个 个 体 P, 和 P,， 随 机 选择 一 个 切 点 (Cutting) ， 将 切 点 两 侧 分 别 
看 作 两 个 子 串 ， 将 右 侧 的 子 串 分 别 交换 ， 则 得 到 两 个 新 的 个 体 C, 和 C, 
如 图 3.2 所 示 。 


切 点 切 点 
， 
= Ai Az 单 切 点 交叉 = Ait B, 
SS 
Py= By} B> C= Bi! Ay 


图 3.2 单 切 点 交叉 示意 图 1 


这 里 ，P, 和 已 称 为 父 代 染 色 体 ，C, 和 C: 称 为 子 代 染 色 体 。 图 3. 3 
是 一 个 具体 的 数值 例子 。 


切 点 切 点 
] 1 
P,- 001! C,- 001^ 
1 001; 101 单 切 点 交叉 1 won 
P= 1011001 Qe 1015101 


图 3.3 单 切 点 交叉 示意 图 2 


显然 ， 切 点 的 位 置 范围 应 该 在 第 一 个 基因 位 之 后 ， 最 后 一 个 基因 位 
之 前 。 即 设 染色 体 长 度 为 x， 则 切 点 的 取 值 范围 为 [1, n -1]。 

单 切 点 交叉 操作 的 信息 量 比较 小 ， 交 叉 点 位 置 的 选择 可 能 带 来 较 大 
偏差 。 并 且 染 色 体 的 末尾 基因 总 是 被 交换 。 在 实际 应 用 中 采用 较 多 的 是 
双 切 点 交叉 。 

QUU RR 

对 于 两 个 选 定 的 染色 体 PA P,， 随 机 选取 两 个 切 点 ， 交 换 两 个 切 
点 之 间 的 子 串 ， 如 图 3.4 所 示 。 


切 点 切 点 切 点 切 点 
Y. uiri 

Pi A Bu € 双 切 点 交叉 Ci An Ba [er 

P,- AQ Ba! Cy G= ^d Bi C; 


134 双 切 点 交叉 示意 图 1 
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图 3.5 是 一 个 具体 的 数值 例子 。 
Da UAR Ws Um 
P,- 0011 tomo: 00 — G= 00111 10001 H 00 
a 


i ， 
P2= 1001110001 1 11 C= 1001! 01110! 11 


图 3.5 双 切 点 交叉 示意 图 2 

在 算法 的 构成 要 素 中 已 经 说 明 ， 并 不 是 所 有 的 被 选中 的 父 代 都 要 进 
行 交 叉 操 作 ， 要 设 定 一 个 交叉 概率 P.， 一 般 取 为 一 个 较 大 的 数 ， 比 如 
0.9, 

(2) 变异 

变异 是 在 种 群 中 按照 变异 概率 P。 任 选 若干 基因 位 改变 其 位 值 ， 对 
于 0-1 编码 来 说 ， 就 是 反 转 位 值 。 变 异 实际 上 是 子 代 基 因 按 照 小 概率 
扰动 产生 的 变化 。 所 以 ， 变 异 概率 一 般 设 定 为 一 个 比较 小 的 数 ， 在 5% 
以 下 。 

5. 选择 策略 

最 常用 的 选择 策略 是 正比 选择 (Proportional Selection) 策略 ， 即 每 
个 个 体 被 选中 进行 遗传 运算 的 概率 为 该 个 体 的 适应 值 和 群体 中 所 有 个 体 
适应 值 总 和 的 比例 。 对 于 个 体 i, 设 其 适应 值 为 F;， 种 群 规模 为 NP， 
则 该 个 体 的 选择 概率 可 以 表示 为 


F, 
= a (3.1) 


> Fe 
得 到 选择 概率 后 ， 采 用 旋 轮 法 (Roulette Wheel) 来 实现 选择 操作 。 
4 
PP, -0 (3.2) 
PP, = 5 Pp, (3.3) 
fa 


共 转 轮 NP 次 。 每 次 转 轮 时 ， 随 机 产生 名 esU(0，1)， 当 PP, < 
名 <PP,， 则 选择 个 体 i 

图 3.6 是 当 NP=10 时 的 示意 图 。 整 个 转 轮 被 分 为 大 小 不 同 的 遍 
面 ， 分 别 对 应 着 不 同 的 个 体 。 各 个 个 体 的 适应 值 在 整个 种 群 的 全 部 个 体 
的 适应 值 之 和 中 所 占 比 例 不 同 ， 这 些 比例 值 占 据 了 整个 转 轮 。 较 高 适应 
值 的 个 体 对 应 着 较 大 圆心 角 的 扇面 ， 而 较 小 适应 值 的 个 体 对 应 着 较 小 圆 
心 角 的 扇面 。 显 然 ， 旋 转 着 的 转 轮 停 在 的 那 一 个 扇面 上 的 概率 与 其 圆心 
角 成 正比 。 
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图 3.6 旋 轮 法 示意 图 


从 图 3.6 中 可 以 看 到 ，P, 的 适应 值 较 高 ， 作 为 优良 的 个 体 ， 其 将 获 
得 较 多 的 繁殖 机 会 ， 后 代 很 像 P, 。 而 已 很 可 能 失去 繁殖 的 机 会 。 

6. 停止 准则 

遗传 算法 的 停止 准则 一 般 是 采用 设 定 最 大 代数 的 方法 ， 最 大 代数 常 
表示 为 NG (Number of Max Generation) 。 


3.2.4 解 空 间 与 编码 空间 的 转换 
通过 前 面 的 说 明 已 经 知道 ， 在 遗传 算法 中 需要 对 染色 体 进行 编码 ， 
使 一 个 染色 体 对 应 优化 问题 的 一 个 解 。 例 如 一 个 问题 的 解 为 整数 50， 
可 以 表示 为 下 面 的 二 进 制 编码 
X= (0110010) 
编码 和 解码 的 过 程 可 以 表示 为 如 图 3.7 所 示 的 过 程 。 
染色 体 问题 的 解 


50 


图 3.7 编码 和 解码 
在 遗传 算法 运行 时 ， 遗 传 运算 是 对 编码 后 的 染色 体 进行 操作 ， 即 在 
编码 空间 内 操作 的 。 而 对 染色 体 进行 评估 与 选择 要 在 解 空 间 进行 。 交 蔡 
地 在 编码 空间 和 解 空间 进行 操作 是 遗传 算法 的 一 个 显著 特点 。 所 以 要 进 
行 两 个 空间 的 转换 ， 如 图 3.8 所 示 。 
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编码 空间 后 代 


图 3.8 编码 空间 与 解 空间 的 转换 
从 编码 空间 到 解 空间 的 映射 可 能 是 三 种 情况 : 
(1) 1 -1 映射 
(2) n -1 映射 
(3) 1 -n 映射 
显然 ，1 -1 映射 是 最 好 的 编码 方式 。 


3.2.5 计算 举例 


下 面 以 一 个 简单 的 例子 来 说 明 遗 传 算法 是 如 何 工作 的 。 

1. 最 优化 问题 

求解 以 下 的 无 约束 优化 问题 
max f(x) =x’ -60x° +900x +100 (3.4) 
xe[0, 30] 


目标 函数 的 二 维 图 形 如 图 3.9 所 示 。 
4500| 


30 第 3 章 遗传 算法 


2. 简单 分 析 

首先 要 将 决策 变量 编码 为 二 进 制 串 形式 的 染色 体 。 染 色 体 的 长 度 取 
决 于 编码 精度 。 设 染色 体 长 度 为 L， 问 题 的 定义 域 为 [a,b] ， 则 编码 
精度 C 可 以 表示 为 


_b-a 
731 (3.5) 
对 于 本 例题 ， 如 果 要 求 编码 精度 为 1， 则 可 计算 染色 体 长 度 如 下 : 
30-0 
< 


2-1" 

从 而 得 到 了 上 >5。 

所 以 取 染 色 体 长 度 为 5， 即 可 满足 精度 要 求 。 

下 面 ， 用 求 导 的 方法 来 分 析 该 问题 的 解 。 令 

f'(x) =3x -120x +900 =3(x -10) (x -30) =0 
则 可 以 得 到 两 个 极 值 点 : x, = 10, x, =30。 
计算 f(x) 的 二 阶 导数 
f'(x) =6x -120 

M x, =10 BY, /"(x) <0， 所 以 为 极 大 值 点 。 

M x, =30 时 , f" (x) >0， 所 以 为 极 小 值 点 。 

3. 步骤 

(1) 产生 初始 种 群 。 设 定 参数 : 种 群 规模 NP =5， 最 大 代数 NC = 
10， 初 始 时 刻 :=0。 

(2) 判断 停止 准则 。 即 判断 最 大 代数 是 否 达 到 NG。 

(3) 计算 适应 值 。 

(4) 用 旋 轮 法 正比 选择 。 

4. 计算 生成 的 列表 

在 表 3.1 中 列 出 了 随机 产生 的 初始 种 群 及 相关 计算 结果 。 表 中 相关 
符号 意义 如 下 : 

j 染色 体 编号 。 

xí 各 个 染色 体 所 对 应 的 问题 的 解 。 

f(x): 染色 体 j 的 目标 函数 值 ， 也 是 其 适应 值 。 

S: 种 群 中 所 有 个 体 的 适应 值 和 。 

fi 种 群 中 所 有 个 体 的 平均 适应 值 。 

Pi: 染色 体 j 被 选中 的 概率 。 
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R31 初始 种 群 及 相关 计算 结果 


j 编码 5 | fla) P, PP, 
n 1011. | 19 ~ 239 0.206 0.206 
^a 00101 5 ams | em 0. 483 
3 nem | 26 516 0. 044 0.527 
4 10101 21 1 801 0.155 0.682 
5 01110 14 | 3684 0.317 0.999 


S-Yf(x) -11625, ji 325, P, E 


用 旋 轮 法 进行 正比 选择 ， 根 据 初 
始 种 群 的 适应 值 计算 得 到 的 概率 ， 选 
择 时 所 使 用 的 转 轮 如 图 3. 10 所 示 。 

对 初始 种 群 中 挑选 出 的 染色 体 进 
行 遗传 运算 时 ， 交 叉 运 算 采 用 单 切 点 
交叉 ， 变 异 操作 采用 基本 位 变异 操 
作 。 相 关 参 数 设置 为 

交叉 概率 : P.=0.9 

变异 概率 : P. -0.02 

遗传 运算 后 得 到 的 子 种 群 及 相关 图 3.10 初始 种 群 进行 选择 


计算 结果 列 于 表 3.2 中。 操作 的 转 轮 示 意图 
R32 第 一 代 子 种 群 及 相关 计算 结果 
P, P, 切 点 ERB 编码 xj fo) 
ac 2 a N 10011 19 2.399 
5 3 EP N owo | 10 4 100 
5 2 3 N 01101 15 3857 
4 2 1 | N | reni "TT 
2 5 4 | N 00100 4 2 804 


S-14 871, f=2 992 
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5. 观察 结果 

从 上 述 计算 结果 ， 可 以 看 到 

(1) 整个 种 群 在 改善 。 种 群 中 所 有 个 体 的 平均 适应 值 从 2 325 增长 
到 2 992。 

(2) 以 0 开始 的 编码 较 好 ， 而 以 1 开始 的 编码 较 差 。 

(3)“ 好 坏 ” 编 码 数量 的 变化 。 如 果 将 以 0 开始 编码 的 个 体 称 为 好 
的 个 体 ， 用 5 表示， 而 以 1 开始 编码 的 个 体 称 为 差 的 个 体 ， 用 5, 表 示 ， 
那么 好 坏 编码 的 数量 变化 是 

Si: 从 2 个 增长 到 3 个 

Sa: 从 3 个 减少 为 2 个 

这 一 好 坏 个 体 的 数量 变化 可 以 由 表 3. 1 中 的 数据 推导 得 到 。 

fn) +f(x3) +f) 


(S5) 945 0 
f = H L9 PU 0.6761 (3.6) 
0.676 1 x3~2 
同 理 
f) +f(xs) 
e» - > -1.485 8 (3.7) 
1.485 8 x2~3 


可 见 ， 好 坏 个 体 数量 的 变化 是 由 其 适应 值 在 整个 种 群 中 所 占 比 例 决 
定 的 。 这 一 计算 结果 符合 适 者 生存 的 规律 。 

此 外 ， 在 交叉 操作 中 ， 双 亲 的 选择 方法 具体 可 以 有 以 下 几 种 方式 。 

(1) 随机 选择 

随机 产生 名 EU(0，1)， 则 (In(£ xNP) +1) e [1, 5], 这 里 ， 
Int 表示 取 整 运算 。 即 ， 可 以 用 (Int(£, x NP) +1) 来 选择 个 体 。 

(2) 比例 选择 

随机 产生 名 < U(0, 1), 34 PP, <é < PP; 时， 选择 个 体 i。 

(3) 父亲 优选 而 母亲 随机 选 


3.3 模板 理论 


模板 理论 (Schema Theory) 是 Holland 在 早期 研究 中 提出 的 ， 对 遗 
传 算法 理论 发 展 具有 重要 意义 。 模 板 理论 是 基于 前 面 所 讲 的 Holland 的 
基本 遗传 算法 。 下 面 首先 来 介绍 模板 (Schema) 的 概念 。 
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3.3.1 模板 的 概念 


定义 3.3.1: 模板 是 若干 位 取 确 定 值 ， 其 他 位 不 确定 的 一 类 个 体 的 
总 称 ， 用 5 来 表示 。 

不 失 一 般 性 ， 以 二 进 制 编码 为 例 , 个体 是 由 二 值 字符 集 V I0, 
1) 中 的 元 素 所 组 成 的 一 个 字符 串 。 而 模板 是 由 三 值 字符 集 V, = 10, 
1，* | 中 的 元 素 所 组 成 的 字符 串 。 其 中 ，“ * ”表示 通配符 ， 它 既 可 
以 被 当 作 是 1， 也 可 以 被 当 作 是 0。 如 3.2.5 节 中 所 提 到 的 两 类 个 体 5， 
和 5, 就 是 两 个 模板 。 

S: on n 

S: Le n n n 

为 了 对 模板 进行 定量 地 描述 ， 下 面 再 引入 模板 的 长 度 和 阶 数 的 概 
Bo 

定义 3.3.2: 模板 的 长 度 !(S) 定义 为 模板 中 从 左 到 右 第 一 个 确定 
位 与 最 后 一 个 确定 位 之 间 的 长 度 。 

定义 3.3.3: 模板 的 阶 数 K(S) 定义 为 模板 中 所 含有 的 确定 基因 位 
的 个 数 。 

例如 模板 S 为 : 141-0 
则 1(S)24, K(S) =3。 

对 于 一 些 特殊 的 模板 ， 如 上 面 提 到 的 S A SIN 

S: Oe n ® 

S derw 
或 者 ， 类 似 下 面 的 模板 

Sj; th nh onn 

由 于 它们 只 有 一 个 确定 基因 位 ， 这 个 位 置 既是 第 一 个 确定 基因 位 ， 
也 是 最 后 一 个 确定 基因 位 ， 所 以 规定 它们 的 长 度 为 1。 

从 上 面 的 例子 可 以 看 出 ， 模 板 的 概念 可 以 简明 地 描述 具有 相似 结构 
的 个 体 的 编码 。 

下 面 来 说 明 一 些 关 于 模板 概念 的 常识 。 

(1) mn 位 编码 的 总 长 度 为 mn-1。 例 如， 对 于 模板 S: 11011, 
KS) =4。 

(2) 阶 数 为 K(S) 的 模板 ,模板 S 中 的 个 体 总 数 为 2 5 

(3) 对 于 一 个 ”位 的 二 进 制 表达 ， 染 色 体 长 度 为 >， 有 

模板 数 > 个 体 数 

即 
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分 类 方法 数 > 个 体 总 数 
因为 模板 中 每 一 位 的 取 值 可 以 为 0，1 或 者 * ， 所 以 模板 总 数 为 3"， 
而 个 体 中 每 一 位 只 能 取 0 或 者 1， 所 以 个 体 总 数 为 2 。 


3.3.2 模板 理论 


引入 了 模板 的 概念 之 后 ， 遗 传 算法 的 群体 进化 过 程 可 以 看 做 是 通过 
选择 、 交 叉 和 变异 运算 ， 来 不 断 寻找 较 好 模板 的 过 程 。 模 板 理论 正 是 在 
分 析 选 择 、 交 叉 和 变异 三 个 运算 对 模板 的 影响 的 基础 之 上 ， 对 模板 的 生 
存 数量 进行 估计 。 模 板 理论 由 三 个 引 理 和 一 个 主 定理 构成 ， 其 相关 结论 
是 在 假设 种 群 规模 不 变 这 一 前 提 下 得 到 的 。 

引 理 3. 3.1: 在 正比 选择 下 ,模板 5 在 第 :+1 代 的 期 望 个 体 数 为 

E(S,t+1) =f(S,t)N(S,t) (3.8) 

其 中 , SCS, 0). 是 第 上 代 S 模板 中 所 有 个 体 的 适应 值 均值 与 种 群 中 所 有 
个 体 的 适应 值 均值 的 比 。N(S，#) 是 第 上 代 属 于 S 模板 的 个 体 数 。 

例如 ， 在 3.2.5 节 中 , MES, (Ove 20, A 

KS, 1) 21.485 8,N(S, ,t) =2, 则 E(S,,t+1) 21.485 8 x2~3。 

证 明 : 

种 群 中 所 有 个 体 的 适应 值 和 为 


Sum = Sr, 
fi 
则 个 体 i 的 选择 概率 为 
F 


5 

BENS: WS 中 的 个 体 总 数 ， 上 且 NS = N(S，#) ， 下 标 随 着 遗传 的 进 
行 而 变化 ; 

Fs: 为 5 模板 中 的 所 有 个 体 的 适应 值 均 值 ; 

T: 为 种 群 中 所 有 个 体 的 适应 值 均值 。 

则 有 


P, = 


E(S,t+1) =(P, +P, ++ +Pys) XN 
-E +F, 十 … + Frys xN 
Sum 
F, +F, 十 … 十 
N(S,t) 
Sum 


N 


F, 
55 x N(S,t) 
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4 x N(S,t) 
=f(S,t) xN(S,t) (3.9) 


证 毕 。 

ATRL, HRS (均值 比 /(S,:) >1) 中 的 个 体 数 在 遗传 运算 中 是 不 
断 增长 的 。 但 是 ， 以 上 证 明 中 没有 考虑 交叉 和 变异 操作 。 而 交叉 和 变异 
是 可 能 破坏 模板 的 ， 所 以 ， 要 研究 一 个 模板 中 的 个 体 在 交叉 和 变异 中 不 
被 破坏 的 可 能 性 。 

对 于 使 用 单 切 点 交叉 操作 的 遗传 算法 有 引 理 3. 3. 2 的 结论 。 

引 理 3.3.2: 第 上代 以 概率 P. 做 交叉 ， 对 长 度 为 !(S) 的 模板 5S 中 
的 个 体 ， 则 在 第 :+1 METEN S 中 个 体 的 概率 下 界 为 

PAS) 


P(S, #4 = 1 i - PCS, t)) 
其 中 , PCS, t) ARMES ane. 
TERA: 
交叉 破坏 5 的 条 件 如 下 : 


GD 进行 了 交叉 操作 ， 概 率 为 P.。 
@ 交 叉 点 在 模板 sw, mS, 


@ 配 偶 P, 不 属于 5， 概率 为 1 -P(S, 0. 
所 以 模板 5 发 生 改 变 的 最 大 概率 为 
P, xD 
n- 


(1-P(S, t)) (3.10) 


Peer E S, 但 是 交叉 后 却 属于 模板 
5 的 情况 ， 所 以 式 (3.10) 为 模板 5 发 生 改 变 的 最 大 概率 。 所 以 ,模板 
S 不 发 生 改变 的 最 小 概率 为 
-2 


(1-P(S, t)) (3.11) 
证 毕 。 
对 于 使 用 简单 基因 位 变异 方式 的 遗传 算法 有 引 理 3. 3. 3 的 结论 。 
引 理 3.3.3: 若 第 上 代 以 概率 P。 做 变异 ， 对 于 一 个 阶 数 为 K(S) 的 
模板 5 中 的 个 体 ， 则 在 第 :+ 1 代 仍 为 S 的 概率 的 下 界 为 
P(S,t+1)>1-P,* K(S) (3.12) 
证 明 : 
对 于 模板 S， 当 K(S) =1 时 ， 不 被 破坏 的 概率 为 1 -P。。 
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当 K(S) >1 时 ， 不 被 破坏 的 概率 为 
(=P, 
取 其 泰勒 展开 式 的 第 一 项 ， 为 


1-P。.K(S) 
所 以 有 
P(S,t+1) =(1-P,)*® 21-P, - K(S) 

证 毕 。 

通过 上 面 3 个 引 理 ， 得 到 了 选择 、 交 叉 和 变异 操作 对 模板 的 影响 。 
由 此 ， 可 以 综合 得 到 下 面 的 主 定理 。 

主 定理 (模板 定理 ) : 第 : 代 以 概率 P. 和 P。 做 交叉 和 变异 时 ， 长 度 
为 KS) ， 阶 数 为 K(S) ， 适 应 值 均值 比 为 KS，:) 的 模板 S 在 第 :+1 HR 
的 期 望 个 体 数 的 下 界 为 
EKS) 


B(S,041) [1 -== (1-P(S,t)) -K(S)P, ]«s.ovcs.o 


(3.13) 
如 果 


a 
KS,» [i -59. PMS) -P(s,D) -KCS)P.] (3.14) 

WW ECS, t) au ube: 

证 明 : 

遗传 算法 每 一 代 种 群 要 经 过 选择 、 交 叉 和 变异 操作 ， 综 合 这 三 个 操 
作 的 共同 作用 ， 由 引 理 3.3.1， 引 理 3.3.2 和 引 理 3.3.3 可 得 ,在 第 t+ 
1 代 属 于 模板 5 的 染色 体 数量 为 
P.L(S) 


(8,041) >i- -PS,0))] 1- -Pp © K(S))f(S,t)N(S,t) 


2[1- TU -P(,0) -KG)P, G0 NC. 0 


证 毕 。 
3.4 改进 与 变形 
前 面 介绍 了 遗传 算法 的 基本 原理 ， 并 以 Holland 的 基本 GA 为 例 说 


明了 算法 的 具体 实现 。 在 实际 应 用 中 ， 针 对 不 同 的 问题 ， 遗 传 算法 可 以 
有 不 同 的 改进 和 变形 。 这 也 是 遗传 算法 内 容 最 丰富 的 部 分 。 在 本 节 中 ， 
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将 首先 介绍 遗传 算法 的 实现 步骤 中 常用 的 改进 与 变形 ; 然后 针对 两 类 常 
见 的 优化 问题 ， 即 约束 优化 问题 和 多 目标 优化 问题 ， 概 述 遗 传 算法 对 它 
们 的 解决 方案 。 


3.4.1 编码 方法 


这 里 来 介绍 除了 0 -1 编码 之 外 的 其 他 三 种 重要 的 编码 方法 。 

1. 顺序 编码 

顺序 编码 是 用 1 到 n 的 自然 数 来 编码 ， 此 种 编码 不 允许 重复 ， 即 
xel, 2, =, n, HI istj Bi, x vx, 又 称 为 自然 数 编码 。 例 如 下 面 
是 一 个 染色 体 长 度 为 n=7 的 顺序 编码 : 

X=(2315476) 

对 于 有 7 个 城市 的 旅行 商 问题 ， 城 市 序号 为 11，2，…，71 ， 则 
上 述 编码 可 以 表示 一 个 行走 的 路 线 。 

该 编码 方法 具有 广泛 的 适用 范围 ， 如 指派 问题 、 旅 行商 问题 和 单机 
调度 等 问题 。 但 是 ， 在 使 用 过 程 中 ， 要 注意 合法 性 问题 ， 即 是 否 符合 所 
采用 的 编码 规则 的 问题 。 满 足 规定 的 编码 规则 的 个 体 称 为 合法 的 个 体 。 
如 下 面 的 编码 即 为 一 个 不 合法 的 编码 : 

X=(2215476) 

因为 上 述 编码 的 前 两 个 基因 的 位 值 相等 ， 违 反 了 顺序 编码 的 规则 。 

2. 实数 编码 

对 于 染色 体 下 = (xz 22, 07, X 1<isn, eR, R} 
实数 集 ， 则 称 该 染色 体 为 实数 编码 。 实 数 编码 具有 精度 高 、 便 于 大 空间 
搜索 、 运 算 简单 的 特点 ， 特 别 适合 于 实 优 化 问题 ,但 是 反映 不 出 基因 的 
特征 。 

3. 整数 编码 

HPR X= (a, ta, s xs ocn x), Lx mns, nS iE 
基因 的 最 大 取 值 ， 则 称 该 染色 体 为 整数 编码 。 显 然 ， 整 数 编码 的 不 同位 
上 的 基因 取 值 可 以 相同 。 例 如 

X=(3212345) 

该 染色 体 对 于 顺序 编码 来 说 是 不 合法 的 ， 而 对 于 整数 编码 来 说 ， 是 
合法 的 。 

整数 编码 可 以 适用 于 新 产品 投入 、 时 间 优 化 和 伙伴 挑选 等 问题 。 例 
如 对 于 6 个 项 目的 伙伴 挑选 问题 ， 各 个 项 目的 备 选 伙伴 数量 为 

n25,n,-26,n,-27, n,-8, n,-2, n, 77 


则 以 下 即 为 一 个 合法 的 编码 : 
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X=(224517) 
3.4.2 遗传 运算 中 的 问题 


在 遗传 运算 的 过 程 中 会 遇 到 不 合法 的 编码 。 比 如 图 3. 11 所 示 的 顺 
序 编码 ， 经 交叉 后 ， 后 代 的 编码 不 合法 。 


切 点 切 点 切 点 切 点 


"m vl. 
P,2211345167 €;2211125167 
SO BRR : 
SS 


or ie se 
Py= 431125176 C17 431345176 


图 3.11 顺序 编码 交叉 产生 不 合法 编码 


对 于 这 种 情况 ， 有 两 种 应 对 策略 : 拒绝 或 者 修复 。 如 果 使 用 拒绝 策 
略 ， 那 么 需要 在 遗传 操作 中 出 现 不 合法 编码 的 比例 很 小 。 如 果 使 用 修复 
策略 ， 那 么 可 能 使 后 代 部 分 丢失 父 代 的 基因 。 

下 面 就 来 介绍 相关 的 修复 策略 ， 来 使 上 面 的 编码 合法 化 。 

1. 顺序 编码 的 合法 性 修复 

首先 来 介绍 如 何 对 顺序 编码 的 不 合法 情况 进行 修复 。 根 据 导致 不 合 
法 编码 的 原因 ， 可 以 分 为 交叉 修复 策略 和 变异 修复 策略 。 

(1) 交叉 修复 策略 

这 里 介绍 三 种 主要 的 交叉 修复 策略 : 部 分 映射 交叉 、 顺 序 交叉 和 循 
环 交 叉 。 

@D 部 分 映射 交叉 (PMX) 

部 分 映射 交叉 (Partially Mapped Crossover, PMX) 是 用 特别 的 修复 
程序 来 解决 简单 的 双 切 点 交叉 引起 的 非法 性 。 所 以 PMX 包括 双 切 点 交 
叉 和 修复 程序 。PMX 的 步骤 如 下 : 

a 选 切 点 X，Y; 

b. 交换 中 间 部 分 ; 

c. 确定 映射 关系 ; 

d. 将 未 换 部 分 按 映射 关系 恢复 合法 性 。 

以 上 步骤 可 以 用 图 3. 12 来 说 明 。 如 果 不 进 行 修复 ， 那 么 子 代 C, 中 
将 出 现 位 值 1，2 的 重复 ， 并 且 丢失 位 值 3，4; 而 子 代 C, 中 将 出 现 位 值 
3，4 的 重复 ， 并 且 丢 失 位 值 !，2。 按 照 确定 的 映射 关系 ,重复 的 位 值 
被 换 掉 ， 而 交换 的 子 串 保持 不 变 。 
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x Y xc 

P 211345167 c» {125} 

214345 a hd ga 

P= 431125176 —434st— 
x Y 映射 关系 
| 

C=431125167 3-1 
I 42 

C 21/345|76 55 


图 3.12 PMX 运算 示意 图 

@ 顺 序 交叉 (OX) 

顺序 交叉 (Order Crossover, OX) 可 以 看 做 是 带 有 不 同 修复 程序 的 
PMX 的 变形 。OX 的 步 又 如 下 : 

a. 选 切 点 X，Y; 

b. 交换 中 间 部 分 ; 

c. 从 第 二 个 切 点 Y 后 第 一 个 基因 起 列 出 原 顺 序 ， 去 掉 已 有 基因 ; 

d. 从 第 二 个 切 点 Y 后 第 一 个 位 置 起 ， 将 获得 的 无 重复 顺序 填 人 。 

以 上 步骤 可 以 用 图 3. 13 来 说 明 。 与 PMX 方式 得 到 的 结果 对 比 ， 可 
以 看 到 ，OX 相当 于 使 用 了 不 同 的 映射 关系 。 


x v 


! ! 
P= 211345 167 


Pz 43125 {76 


x Y 列 出 基因 
1 1 
Cr=341125167 a 6724345 


C= 124345 |76 7643125 


图 3.13 OX 运算 示意 图 
OX 较 好 地 保留 了 相 邻 关 系 、 先 后 关系 ， 满 足 了 TSP 问题 的 需要 ， 
但 是 不 保留 位 值 特征 。 
图 循环 交叉 (CX) 
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循环 交叉 (Cycle Crossover, CX) 的 基本 思想 是 子 串 位 置 上 的 值 必 
须 与 父母 相同 位 置 上 的 值 相等 。CX 的 具体 步骤 如 下 

a. 选 已 的 第 一 个 元 素 作为 C, 的 第 一 位 ; 选 P, 的 第 一 个 元 素 作为 
C: 的 第 一 位 ; 

b. Æ P PR P, 的 第 一 个 元 素 赋 给 C, 的 相对 位 置 …… 重 复 此 过 程 ， 
直到 P, 上 得 到 P, 的 第 一 个 元 素 为 止 ， 称 为 一 个 循环 ; 

c. 对 最 前 的 基因 按 P,、P, 基 因 轮 替 原则 重复 以 上 过 程 ; 

d. 重复 以 上 过 程 ， 直 到 所 有 位 都 完成 。 

以 上 步骤 可 以 用 图 3. 14 来 说 明 。 


P=245389617 2__3__6__ 
Pj7398654271 3.26 2. 
循环 1: 2-3-6 循环 2: 9-4 


图 3.14 CX 运算 示意 图 

与 OX 特点 不 同 ，CX 较 好 地 保留 了 位 值 特征 ， 适 合 指派 问题 ; 而 
OX 由 于 较 好 地 保留 了 相 邻 关系 而 更 适合 TSP 问题 。 

(2) 变异 修复 策略 

这 里 介绍 两 种 主要 的 变异 修复 策略 ， 换 位 变异 和 移 位 变异 。 

Die (i EF 

换 位 变异 是 随机 地 在 染色 体 上 选取 两 个 位 置 ， 交 换 基因 的 位 值 ， 如 
图 3.15 所 示 。 


xxr c E E AIT 


I 
2134567. C> — 2164537 


图 3.15 换 位 变异 示意 图 
QB LEH 
移 位 是 任意 选择 一 位 基因 ， 将 其 移动 到 最 前 面 ， 如 图 3. 16 所 示 。 
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jx TER 移 至 最 前 


2134567 C> 4213567 


A316 换 位 变异 示意 图 
2. 实数 编码 的 合法 性 修复 
实数 编码 是 用 实 向 量 忆 = (zy, %3, 7, Xs 7, X), LSisan 
xi e 及 ， 来 表示 解 的 染色 体 。 可 以 使 用 类 似 二 进 制 表达 的 交叉 和 变异 操 
作 ， 也 可 以 使 用 特殊 的 遗传 操作 ， 下 面 详细 介绍 。 
(1) BM 
(D UL A SEX 
使 用 类 似 二 进 制 表达 的 交叉 方法 对 实数 编码 进行 操作 ， 最 基本 的 是 
单 切 点 交叉 。 令 双亲 为 
Py: X=(x,, 2r, s 2n) 
Pr: Yz(n, Yor cn Y) 
随机 在 第 大 位 交叉 ， 则 可 表示 为 如 图 3.17 所 示 的 示意 图 。 


切 点 
Py: Xm, Sas tto Sar gp Saers o Sa) 
Pi: Fely, Yu > N) 
C: X2(, x, (») 
Cy: Y= Xeon (mx) 
图 3.17 实数 编码 单 切 点 交叉 示意 图 


QM MER 
SCBUR HDD ALG RMA, MIAA S k, 
4， 交换 中 间 部 分 ， 可 表示 为 如 图 3. 18 所 示 的 示意 图 。 


切 点 切 点 
Pa X= Cay Rss Re Le TF ER t a) 
Pa Y= yao Yd nas Yen n Ya) 
Cy: X2, x.t Zas p Yaso 77 Ux) 
C; Y= (ps Yo ts m Ehe n Ue») 


图 3. 18 实数 编码 双 切 点 交叉 示意 图 
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观察 实数 编码 的 单 切 点 和 双 切 点 交叉 ， 显 然 产 生 的 子 代 也 是 合法 的 
编码 。 但 是 ， 对 于 实数 编码 来 说 进行 单 切 点 或 者 双 切 点 交叉 后 要 注意 解 
的 可 行 性 问题 。 所 谓 可 行 性 是 指 染色 体 解 码 成 为 解 之 后 是 否 在 给 定 问题 
的 可 行 域 范围 内 的 性 质 。 与 二 进 制 编码 类 似 的 交叉 方法 在 实数 编码 上 进 
行 操作 时 很 容易 导致 解 的 不 可 行 性 。 下 面 以 最 简单 的 二 维 实数 编码 为 例 
进行 说 明 ， 如 图 3. 19 所 示 。 


CD 


[83.19 实数 编码 单 切 点 交叉 导致 不 可 行 示意 图 
图 3.19 中 弧 形 区 域 为 问题 的 可 行 域 ， 两 个 父 代 编码 分 别 为 


P,(1, 3) 和 P,(5,1)， 单 切 点 交叉 后 得 到 两 个 子 代为 : C,(1,，1) 和 
C,(5, 3), Tj C, 为 不 可 行 解 。 
图 凸 组 合 交叉 


为 了 克服 上 面 简单 交叉 操作 导致 的 解 的 不 可 行 性 ， 可 以 使 用 凸 组 合 
交叉 。 这 种 运算 的 基本 概念 源 于 凸 集 理论 。 对 于 双亲 


Py: X= (n, %3, 0, x) 
Pr: Y= (Vis Yar s Ya) 
凸 组 合 交叉 是 将 上 述 两 个 染色 体 进行 如 下 操作 : 
Z,=aX+ (l-a) 了 
Z,= (l-a) X*aY 
即 
ax, + (1 -a)y, (1 -a)x, * ay, 
ax, +(l-a)y, (1 -a@)x, +ay, 
OX E ,Da = . 
ax, +(1-a)y, (1 -a)x, * ay, 
这 里 ，a >0。 


若 约束 是 个 凸 集 ， 则 可 行 性 将 得 以 保持 。 但 是 ， 这 样 的 交叉 操作 将 
导致 种 群 的 分 散 性 不 好 ， 基 因 取 值 向 中 间 汇 集 的 问题 需要 解决 。 图 
3.20 是 这 个 问题 的 一 个 示意 图 。X, 和 X, 进 行 交叉 ， 由 于 a >0， 所 以 得 
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到 的 子 代 染色 体 X M XA OX, AX, SRE. IEEE XO OX, HE 
行 交 叉 得 到 的 子 代 X H A 将 处 于 导 和 和 之 间 的 线 仆 上 。 新 的 种 群 继 
续 进 行 同样 的 交叉 操作 ， 那 么 无 论 是 如 何 进行 配对 ， 得 到 染色 体 所 覆盖 
的 区 域 都 将 越 来 越 小 。 


X 


x 


图 3. 20 AAEN PIR E 
(2) 变异 
人 位 值 变异 
二 进 制 编 码 的 染色 体 ， 其 位 值 只 能 有 0，1 两 种 选择 。 而 实数 编码 
的 染色 体 ， 其 位 值 可 以 在 一 定 范围 内 变化 。 对 于 实数 编码 的 染色 体 开 = 
(x1，x2，*…，z*,)， 位 值 变 异 是 在 其 基因 中 任 选 一 位 x,(1<k<n)， 对 
其 进行 如 下 变异 : 
x =x +ô 
则 变异 后 的 染色 体 为 : Zo. m.s msc ) 
这 里 ，5 称 为 变异 步 长 ， 应 在 一 定 范围 内 随机 产生 ， 该 范围 可 以 取 
为 x, 的 上 下 界 ， 一 般 根据 问题 的 约束 域 来 确定 。8 可 以 服从 均匀 分 布 、 
指数 分 布 和 正 态 分 布 等 。 
@@ 向 梯度 方向 变异 
对 于 目标 函数 可 微 的 问题 ， 实 数 编码 的 染色 体 也 可 以 向 梯度 方向 变 
5. 
对 于 最 大 化 问题 ， 可 以 采用 如 下 变异 操作 
Z=X+Vf(X)-a 
ae U(0, a) 
HH, VAX) 是 目标 函数 在 下 处 的 梯度 。 
对 于 最 小 化 问题 ， 可 以 采用 如 下 变异 操作 : 
Z-X- Vf(X)*a 
aeU(0, a) 
向 梯度 方向 的 变异 使 遗传 算法 运行 时 考虑 到 了 问题 本 身 的 性 质 ， 所 
以 效率 较 高 。 但 是 ， 染 色 体 种 群 也 可 能 因此 而 趋 于 聚集 ， 导 致 种 群 的 多 
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样 性 较 差 。 
3.4.3” 适 值 函数 的 标定 


1. 标定 的 目的 

在 算法 的 基本 原理 中 介绍 了 标定 是 将 目标 函数 映射 为 适 值 函 数 。 将 
个 体 的 适应 值 规定 为 非 负 ， 从 而 能 够 直接 将 适 值 函 数 与 群体 中 的 个 体 优 
劣 相 联系 。 特 别 是 对 于 最 小 化 问题 ， 必 须 通过 标定 使 目标 函数 映射 为 适 
值 函数 ， 在 任何 情况 下 适 值 函 数 总 是 越 大 越 好 ， 理 论 上 最 简单 的 标定 方 
式 为 


F(x) = - min f(x) 

即将 其 转化 为 最 大 化 问题 ， 从 而 实现 正比 选择 。 这 可 以 看 做 是 标定 的 第 
一 个 目的 。 

为 了 说 明 标定 的 第 二 个 目的 ， 首 先 介绍 选择 压力 的 概念 。 

(1) 选择 压力 的 概念 

选择 压力 是 指 种 群 中 好 、 坏 个 体 被 选中 的 概率 之 差 。 如 果 差别 较 
大 ， 则 称 选择 压力 大 。 

例如 : 五 个 染色 体 构成 的 一 个 种 群 ， 其 目标 函数 值 分 别 为 


万 =1010 
fa =1 008 
f, =1 002 
f, =1 005 
f,=1 015 
则 ， 各 个 染色 体 被 选中 的 概率 为 
f£ 1002 
P$ 750979? 


显然 在 选择 过 程 中 ， 由 于 目标 函数 之 间 的 相对 差别 很 小 ， 所 以 各 个 
染色 体 被 选中 的 概率 差别 很 小 ， 即 选择 压力 小 ， 这 将 导致 遗传 算法 的 选 
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优 功能 被 弱化 。 所 以 要 对 目标 函数 进行 标定 ， 来 调节 选择 压力 。 这 是 要 
对 目标 函数 进行 标定 的 第 二 个 目的 。 对 于 以 上 例子 ， 可 以 进行 如 下 标 
定 : 

F =f-1 000 
则 各 个 染色 体 的 适 值 分 别 为 

F, =f, -1000 =10 

F, =f, -1 000 =8 

F, =f, -1 000 =2 

F, =f, -1 000 =5 

F, =f, -1 000 =15 

标定 后 各 个 染色 体 被 选中 的 概率 为 
F, 10 


M. 
" 
a| 
" 
~» èl 
" 
e 
N 
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显然 标定 后 ， 各 个 染色 体 被 选中 的 概率 差别 大 幅度 增加 ， 即 选择 压 
力 增 大 了 。 通 过 上 面 的 例子 可 以 看 到 ， 适 值 函数 的 标定 可 以 调节 选择 压 
力 的 大 小 。 而 通过 调节 选择 压力 的 大 小 能 够 实现 遗传 算法 中 局 部 搜索 和 
广 域 搜索 的 调节 。 

(2) 局 部 搜索 、 广 域 搜索 与 选择 压力 的 关系 

局 部 搜索 是 针对 一 个 较 小 的 区 域 进 行 搜索 ， 致 力 于 找到 更 好 、 更 精 
确 的 解 。 而 广 域 搜索 是 进行 大 面积 的 搜索 ， 希 望 找到 较 好 的 解 存在 的 区 
域 。 显 然 ， 局 部 搜索 和 广 域 搜索 是 遗传 算法 中 的 一 对 矛盾 ， 只 注重 局 部 
搜索 很 可 能 陷 人 局 优 ， 只 注重 广 域 搜索 则 会 导致 精确 开发 能 力 不 强 。 一 
个 效果 良好 的 算法 应 该 将 以 上 二 者 综合 考虑 ， 即 平衡 好 局 部 搜索 与 广 域 
搜索 的 矛盾 。 

一 般 来 说 ， 遗 传 算法 在 开始 时 应 该 注重 广 域 搜 索 ， 通 过 使 用 较 小 的 
选择 压力 来 实现 ; 随 着 迭代 的 进行 ， 逐 步 偏重 于 局 部 搜索 ， 通 过 使 用 较 
大 的 选择 压力 来 实现 。 
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2. 适 值 的 标定 方法 
下 面 介绍 几 种 重要 的 适 值 标定 方法 。 
(1) 线性 标定 
线性 标定 是 采用 如 下 的 标定 方法 : 
F=af+b 
其 中 ，/ 为 目标 函数 ，P 为 标定 后 的 适 值 函数 。 参 数 a。 Md 要 根据 不 同 
的 问题 进行 设 定 。 
@ 最 大 化 问题 
对 于 最 大 化 问题 max f(x), Waal, b= -fan +E, WGA 
数 为 
F-f(x) -fun +E 
Hp, 是 一 个 较 小 的 数 ， 目 的 是 使 种 群 中 最 差 的 个 体 仍然 有 繁殖 的 机 
会 ， 增 加 种 群 的 多 样 性 。 
加 最 小 化 问题 
对 于 最 小 化 问题 min f(x), THUG a= -1，5 =/f。。 +E, JETER 
数 为 
F= -f(x) +fo +E 
其 中 , 上 也 是 一 个 较 小 的 数 ， 其 意义 与 最 大 化 问题 中 的 设置 相同 。 
(2) 动态 线性 标定 
线性 标定 中 的 参数 随 着 迭代 次 数 的 增加 而 变化 时 就 得 到 了 动态 线性 
标定 。 动 态 线性 标定 是 最 常用 的 一 种 适 值 标定 方法 。 可 以 表达 如 下 : 
Fza'f4b* 
其 中 ， 上 标 上 为 迭代 指标 ， 表 明 参 数 是 随 着 迭代 次 数 的 增加 而 变化 的 。 
@ 最 大 化 问题 
对 于 最 大 化 问题 ， 可 以 令 a =1，b* = -fint WEE RYA 
F=f -fan +E 
其 中 ,所 , 是 第 上 代 的 最 小 目标 函数 值 ; * 是 一 个 较 小 的 数 ， 目 的 与 线 
性 标定 中 的 相同 ， 是 使 种 群 中 最 差 的 个 体 仍然 有 一 点 点 繁殖 的 机 会 ， 
从 而 增加 种 群 的 多 样 性 。 否 则 最 差 的 个 体 因为 适 值 为 0， 必 然 消 失 在 进 
化 的 过 程 中 。#* 应 该 随 着 的 增 大 而 碱 小 ，* 可 以 采用 如 下 的 设置 方 
式 : 
g-M 
gag ter 
re[0.9,0.999] 
通过 调节 M Ar 可 以 实现 对 大 的 调节 。 
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加 最 小 化 问题 

对 于 最 小 化 问题 min f(x), WS a= -1, bo fi, +e, MSE 
数 为 

F= -ftfin +E 

EP, P 也 是 一 个 较 小 的 数 ， 其 意义 与 最 大 化 问题 中 的 设置 相同 。 

Ge 对 于 调节 选择 压力 的 作用 

E 的 引入 能 够 调节 选择 压力 ， 即 好 坏 个 体 选 择 概率 的 差 ， 使 广 域 
搜索 范围 宽 ， 保 持 种 群 的 多 样 性 ; 而 局 部 搜索 细致 ， 保 持 收敛 性 ， 如 图 
3.21 所 示 。 


图 3.21 选择 压力 的 调节 
在 算法 开始 运行 的 时 候 ， 希 望 选 择 压 力 较 小 ， 所 以 E BERK, 
使 不 同 个 体 间 的 选择 概率 相差 不 大 ; 到 种 群 进化 的 后 期 ， 希 望 选择 压力 
BK, MA E 取 值 较 小 ， 使 不 同 个 体 间 的 选择 概率 相差 大 ， 种 群 将 很 
快 达到 收敛。 
G) Xt 
告 律 标定 是 采用 如 下 的 构造 方式 
F=f* 
Hp, a 可 以 用 来 调节 选择 压力 : 
a>1 时 ， 选 择 压力 加 大 ; 
a<1 时 ， 选 择 压力 减 小 。 
当 a 趋 近 于 0 时， 显然 将 成 为 随机 搜索 。 竺 律 标 定 是 比较 费时 的 ， 
要 针对 具体 问题 使 用 。 
(4) 对 数 标 定 
对 数 标定 可 以 用 于 缩小 目标 函数 值 的 差别 。 其 一 般 形 式 为 
F=alnf+b 
参数 a Mb 根据 具体 问题 而 定 。 例 如 对 于 最 小 化 问题 ， 可 以 具体 设 
置 为 
F=-Inf+b 
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HEH, b>In(f,,,) 0 
(5) 指数 标定 
指数 标定 的 作用 是 扩大 目标 函数 值 的 差别 ， 其 一 般 形式 为 
下 =aey +c 
参数 a、b Mc 根据 具体 问题 而 定 。 
(6) 窗口 技术 
采用 窗口 技术 的 适 值 标定 方法 如 下 
F zaf - f. 
HP, w 是 窗口 大 小 ; f. 是 前 w 代 中 的 最 小 目标 值 ; w 的 大 小 可 以 取 为 
2-10, 

从 表达 式 可 以 看 到 ， 实 际 上 窗口 技术 也 是 一 种 动态 线性 标定 方 
法 。 该 技术 的 本 质 是 将 记忆 引入 了 适 值 标定 中 ,考虑 到 了 各 代 /的 
波动 。 

(7) 正规 化 技术 

正规 化 技术 的 作用 是 将 了 映射 到 (CO, 1) 区 间 ， 抑 制 超级 染色 体 。 
正规 化 技术 也 是 一 种 特殊 的 动态 线性 标定 技术 。 对 于 最 大 化 问题 ， 标 定 
方法 如 下 


-人 e+ 
六. “San tr 
其 中 ,re (0，1) 。 上 述 方法 相当 于 对 公式 
F=a'f+b' 
进行 了 如 下 设置 : 
n 1 s Sa th 


© Fa San tT Same fo +T 


对 于 最 小 化 问题 可 以 标定 如 下 : 


3.4.4 选择 策略 


传统 的 遗传 算法 的 选择 和 遗传 是 一 起 进行 的 ， 即 使 后 代 不 如 父 代 ， 
也 无 法 纠正 。 下 面 介绍 的 选择 策略 都 是 先 遗 传 后 选择 。 这 样 ， 样 本 空间 
扩大 了 ， 可 供 选择 的 个 体 增多 了 。 

1. 截断 选择 

选择 最 好 的 前 T 个 个 体 ， 让 每 一 个 有 1/7 的 选择 概率 ， 即 平均 每 
个 得 到 NP/T 个 繁殖 机 会 。 
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例如 : NP=100, T=50, 那么 前 50 个 染色 体 每 个 的 选择 概率 为 
1/50， 每 个 染色 体 平均 被 选中 两 次 。 


显然 ， 这 种 选择 策略 将 要 花费 较 多 时 间 在 适应 值 的 排序 上 。 
2. 顺序 选择 


(1) 顺序 选择 的 步骤 

@D 从 好 到 坏 排序 NP 个 个 体 

@ 定 义 最 好 个 体 的 选择 概率 为 gs， 则 第 j 个 个 体 的 选择 概率 为 
PG) =40 -4)' 


" 
Gib Y au - 0^ == Waste 当 NP 有 限时 ， 


NP 


FA- < 1 ， 所 以 要 对 所 有 个 体 的 概率 和 进行 归 一 化 。 令 


fel 


p,za(1-4)^*, Seg = 


ee Deere 
0-9)" 
(2) 顺序 选择 的 特点 
顺序 选择 的 优点 是 选择 概率 可 以 离线 计算 ,那么 可 以 节省 算法 执行 
时 间 ， 并 且 选 择 压力 可 控 ; 其 缺点 是 把 选择 概率 固定 化 ， 导 致 在 算法 的 
执行 过 程 中 选择 压力 不 可 调节 。 
(3) 一 个 计算 例子 
种 群 中 个 体 的 概率 如 下 
No. 1 一 P 2470.1 
No. 2—p, =4(1-4) =0.09 
No.3 一 p 2 q(1 -9) =0. 081 


XNe =1 
则 可 以 采用 旋 轮 法 进行 选择 ， 令 
PP, = Py 
PP2 =P; +P2 
PPs =P. + Pi +P 
PP: = PPs-1 + Px 
随机 产生 所 eU(0，1) ， 当 PP, <é «PP, 时 ， 选 择 个 体 i。 
3. 正比 选择 
具体 实现 方式 同 3.2.3 节 中 所 述 ， 但 是 选择 操作 是 在 遗传 操作 之 后 
进行 。 用 动态 标定 来 调节 选择 压力 ， 采 用 旋 轮 法 来 共同 完成 种 群 的 
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选择 。 
3.4.5 停止 准则 


在 基本 遗传 算法 中 ， 介 绍 了 一 般 采 用 最 大 代数 作为 算法 的 停止 准 
则 。 该 方法 简单 易 行 ， 但 是 并 不 准确 。 因 为 可 能 在 最 大 代数 之 前 算法 已 
经 收 剑 ， 也 可 能 在 最 大 代数 时 算法 还 未 收敛。 还 可 以 根据 种 群 的 收敛 程 
度 ， 即 种 群 中 适应 值 的 一 致 性 来 判断 是 否 算法 停止 。 在 算法 的 执行 过 程 
中 保留 历史 上 最 好 的 个 体 ， 观 察 指标 
F 
F, 


其 中 ,为 种 群 中 所 有 个 体 适应 值 的 平均 值 ，F。 为 所 有 个 体 适应 值 
的 最 大 值 。 当 上 述 指标 趋 近 于 1 时 ， 说 明 种 群 收敛 。 同 样 也 可 以 使 用 
公式 


IF -FI <e 
SIF, -FI «s 
但 是 用 上 述 判断 适应 值 一 致 性 的 方法 较为 麻烦 ， 所 以 较 少 使 用 。 


3.4.6 高 级 基因 操作 


遗传 算法 中 的 主要 遗传 操作 是 选择 、 交 叉 和 变异 ， 它 们 又 称 为 主要 
算 子 。 另 外 还 有 一 些 人 根据 生物 进化 和 遗传 的 机 理 提出 了 高 级 基因 操 
作 ， 或 者 称 为 次 要 算 子 ， 例 如 ， 倒 位 操作 (Inversion Operation) 、 显 性 
操作 (Dominance Operation) 、 生 态 操作 (Niche Operation) 、 迁移 操作 
(Migration Operation) 、 性 别 区 分 (Sexual Differentiation) 等 。 这 些 基因 
操作 的 研究 是 遗传 算法 理论 研究 中 最 为 丰富 多 彩 的 内 容 。 

这 些 基因 操作 来 源 于 群体 遗传 学 ， 目 前 应 用 尚 少 ， 其 作用 机 理 尚 不 
明 或 没有 普遍 意义 ， 还 有 待 于 进一步 的 研究 。 下 面 来 介绍 其 中 使 用 相对 
较 多 的 两 种 操作 : 倒 位 操作 和 显 性 操作 。 

1. 倒 位 操作 

倒 位 操作 是 顺序 翻转 染色 体 中 两 个 倒 位 点 之 间 的 基因 排列 顺序 ， 从 
而 形成 一 个 新 的 染色 体 。 倒 位 操作 的 具体 过 程 如 下 : 

(1) 在 染色 体 中 随机 指定 两 个 基因 之 后 的 位 置 为 倒 位 点 ; 

(2) 以 倒 位 概率 ,顺序 翻转 两 个 倒 位 点 之 间 的 基因 。 

图 3. 22 是 对 二 进 制 编码 的 染色 体 进行 倒 位 操作 的 一 个 示意 图 。 
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倒 位 点 BIRLA 
A= 101|10110| 10 一 一 一 > B= 101 }011011 10 


3.22 倒 位 操作 示意 图 
如 果 染 色 体 很 长 的 话 ， 也 可 以 实施 多 段 的 倒 位 操作 ， 如 图 3.23 所 
示 。 


倒 位 点 。 倒 位 点 倒 位 点 。 倒 位 点 
4-101] 10110 |100 10001110110 


[ses 
B101! 01101 [100 | 11000 | 0110 


图 3.23 ”多段 倒 位 操作 示意 图 

倒 位 操作 可 能 使 染色 体 产生 较 大 的 变化 ， 对 于 长 度 很 大 的 染色 体会 
有 积极 的 意义 ， 通 常 的 交叉 或 者 变异 不 易 取 得 这 种 效果 。 

之 前 的 编码 方式 往往 基于 如 下 假设 : 基因 的 功能 意义 与 其 位 置 是 相 
互 关 联 的 ， 各 个 固定 的 位 置 有 各 自 固定 的 功能 。 这 种 假设 对 于 倒 位 操作 
有 时 是 不 可 取 的 。 比 如 生物 进化 过 程 中 ， 各 个 基因 的 位 置 可 能 变动 ， 但 
是 各 种 基因 所 起 的 作用 却 是 固定 不 变 的 ， 即 基因 的 功能 与 位 置 是 相互 独 
立 的 。 所 以 ， 有 时 需要 将 基因 的 功能 与 其 位 置 互相 分 离 ， 这 可 以 通过 如 
图 3. 24 所 示 的 染色 体 的 扩展 形式 来 表示 。 


倒 位 点 ” 倒 位 点 
1213456 1789 — 基因 的 位 置 


4-101 1101 1101 —— 3t 


13.24 染色 体 的 扩展 形式 
在 染色 体 的 扩展 形式 中 ,第 一 行 是 基因 的 位 置 (或 者 成 为 基因 
AD, ， 第 二 行 是 基因 的 位 值 。 在 图 3. 24 所 示 位 置 进行 倒 位 操作 之 后 ， 则 
得 到 如 图 3. 25 所 示 的 新 的 个 体 。 


BL 倒 位 点 
1216543 1789 — 基因 的 位 置 


5-10] 1011 [101 一 一 基因 的 位 值 


图 3.25 染色 体 扩展 形式 的 倒 位 操作 结果 


从 扩展 形式 的 倒 位 操作 结果 可 以 看 到 ， 基 因 的 值 总 是 与 它们 原来 的 
位 置 (EAM) 相关， 或 者 说 各 个 位 值 保持 了 其 原来 的 意义 。 这 样 ， 
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对 于 扩展 形式 ， 单 纯 的 倒 位 操作 将 不 会 对 染色 体 的 译 码 结果 有 影响 。 

倒 位 操作 是 对 单个 染色 体 进行 操作 ， 与 其 类 似 的 操作 还 有 换 序 操 
作 、 移 序 操作 等 ， 这 里 不 再 详 述 。 

2. 显 性 操作 

显 性 操作 要 首先 从 自然 界 中 染色 体 的 二 倍 体现 象 说 起 。 自 然 界 中 简 
单 生物 的 染色 体形 式 是 单 倍 体 ， 而 高 等 动 植物 的 染色 体形 式 往往 是 二 
CR) 倍 体 或 多 倍 体 。 所 谓 二 倍 体 是 指 含有 两 个 同 源 基 因 组 的 个 体 。 如 
人 的 染色 体 就 是 23 对 二 倍 体 构成 的 一 种 复杂 的 结构 形式 。 二 倍 体 结构 
中 各 个 基因 有 显 性 基因 和 隐 性 基因 之 分 。 这 两 类 基因 使 个 体 所 呈现 出 的 
表现 型 由 下 述 规则 决定 : 在 每 个 基因 座 上 ， 当 两 个 同 源 染色 体 的 基因 之 
一 是 显 性 时 ， 则 该 基因 所 对 应 的 性 状 表现 为 显 性 ; 而 仅 当 两 个 同 源 染 色 
体 中 对 应 基因 全 部 为 隐 性 时 ， 该 基因 对 应 性 状 才 表 现 为 隐 性 。 二 倍 体 记 
忆 了 以 前 有 用 的 基因 及 基因 组 合 。 显 性 提供 了 一 种 算 子 ， 它 保护 所 记忆 
的 基因 免 受 有 害 选 择 运算 的 破坏 。 

二 倍 体 的 应 用 意义 在 于 记忆 能 力 和 显 性 操作 的 鲁 棒 性 。 前 者 使 基于 
二 倍 体 结构 的 遗传 算法 能 够 解决 动态 环境 下 的 复杂 系统 的 优化 问题 ， 易 
于 跟踪 环境 的 动态 变化 过 程 ， 后 者 使 得 即使 随机 选择 了 适应 值 不 高 的 个 
体 ， 而 显 性 操作 可 以 利用 另 一 同 源 染 色 体 对 其 进行 校正 ， 从 而 提高 运算 
效率 ， 保 持 好 的 种 群 。 

这 里 介绍 Holland 表述 的 单 基因 座 显 性 映射 方法 。 在 这 种 方法 中 ， 


描述 基因 的 字符 集 为 10，1，1。1 ， 其 中 1。 为 隐 性 的 1，1 为 显 性 的 1。 
其 映射 关系 如 图 3. 26 所 示 。 
ow 1 
ol 
加 右面 
gnng 


图 3.26 单 基因 座 显 性 映射 方法 
使 用 二 倍 体 的 遗传 算法 结构 与 基本 遗传 算法 结构 差别 在 于 
(1) 显 性 性 状 也 能 进化 ， 所 以 同 源 染 色 体 之 间 也 需 进 行 交叉 操作 。 
(2) 变异 操作 考虑 隐 性 性 状 。 
(3) 对 染色 体 进行 交叉 、 变 异 操作 后 要 进行 显 性 操作 。 
关于 显 性 操作 对 于 动态 环境 中 优化 问题 的 解决 具有 重要 意义 ， 在 第 
9 章 中 将 进一步 讲解 。 
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3.4.7 约束 的 处 理 


约 东 优化 (Constrained Optimization) 是 处 理 具 有 等 式 和 (R) 不 
等 式 约束 的 目标 函数 问题 ， 是 人 们 在 实践 中 遇 到 最 多 的 数学 规划 问题 之 
一 。 其 一 般 形式 可 以 表示 为 

min f(x) 
st g(x) <0 
h(x) =0 
其 中 , x 为 nx1 向 量 ; gA mR BK, h 为 1 维 向 量 函 数 ; /为 标 
量 函 数 。 
ACARI (ATH) 为 
S={xl g(x) <0, h(x) =0} 

一 般 的 约束 优化 问题 的 求解 难度 是 很 大 的 ， 由 于 其 复杂 性 ， 无 论 在 
理论 研究 方面 还 是 实际 应 用 方面 都 有 很 大 难度 ， 因 此 吸引 了 很 多 研究 者 
投入 其 中 ， 寻 求 有 效 的 求解 方法 。 遗 传 算法 是 其 中 一 种 常用 的 方法 。 

用 于 操作 染色 体 的 遗传 算法 常会 产生 不 可 行 的 染色 体 的 问题 。 因 此 
处 理 约束 对 于 遗传 算法 解决 约束 优化 问题 非常 重要 。 一 般 来 说 ， 可 以 将 
遗传 算法 处 理 约束 的 方法 分 为 以 下 几 类 。 

1. 拒绝 策略 

拒绝 策略 是 抛弃 进化 过 程 中 产生 的 所 有 不 可 行 解 。 这 是 遗传 算法 处 
理 约束 问题 的 最 简单 也 是 效率 最 低 的 方法 。 当 可 行 解 不 容易 达到 时 ， 很 
难 达到 一 个 初始 种 群 。 

2. 修复 策略 

修复 策略 是 在 进化 过 程 中 获得 不 可 行 解 后 ， 将 其 修复 为 可 行 解 ， 对 于 
很 多 组 合 优化 问题 创建 修复 过 程 相对 容易 ， 但 是 可 能 导致 失去 种 群 多 样 性 。 

3. 惩罚 策略 

惩罚 策略 是 对 约束 进行 处 理 的 最 一 般 的 方式 ， 是 通过 对 不 可 行 解 的 
惩罚 来 将 约束 问题 转化 为 无 约束 问题 。 任 何 对 于 约束 的 违反 都 要 在 目标 
函数 中 添加 惩罚 项 。 这 就 要 设计 适当 的 惩罚 函数 ， 但 是 惩罚 函数 设计 不 
适当 则 容易 掩盖 目标 函数 的 优化 。 

4. 特殊 的 编码 和 遗传 策略 

也 可 以 使 用 特殊 的 编码 策略 ， 在 编码 时 就 充分 考虑 约束 问题 ， 在 编码 
时 产生 的 都 是 符合 约束 的 染色 体 。 为 了 使 染色 体 在 遗传 操作 后 仍然 保持 可 
行 性 ， 也 要 使 用 特殊 的 遗传 策略 ， 使 遗传 操作 后 染色 体 仍然 保持 可 行 。 

在 本 书 的 3. 5. 1 节 中 将 以 背包 问题 为 例 详细 说 明 几 种 解决 约束 问题 
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的 方法 。 
3.4.8 多 目标 的 处 理 


现实 的 生产 和 生活 中 人 们 常常 遇 到 存在 的 目标 超过 一 个 ， 并 且 需 要 
同时 处 理 的 情况 ， 而 这 些 不 同 的 目标 又 往往 是 相互 冲突 的 ， 这 就 是 多 目 
标 优化 〈 Multiobjective Optimization) 问题 。 具 有 Pp 个 目标 的 多 目标 问题 
的 一 般 形式 可 以 表示 为 

min f(x) 2 min[f (x) , f(x), f(x)] 
s.t g(x) <0 
h(x) <0 

这 里 x 为 nxl 向 量 , g 为 m 维 向 量 函 数 ,h 为 1 维 向 量 函 数 , f 为 
p 维 向 量 函 数 。 

可 记 约 束 集 (可行 集 ) 为 

S= [xl g(x) «0,h(x) =0} 

在 大 多 数 情况 下 ， 各 个 目标 函数 间 可 能 是 冲突 的 。 这 就 使 得 多 目标 
优化 问题 不 存在 唯一 的 全 局 最 优 解 ， 使 所 有 目标 函数 同时 最 优 。 但 是 
可 以 存在 这 样 的 解 : 对 一 个 或 几 个 目标 函数 不 可 能 进一步 优化 ， 而 对 其 
他 目标 函数 不 至 于 劣化 ， 这 样 的 解 称 之 为 非 劣 最 优 解 。 

定义 3.4.1 ( 非 劣 解 ) : 对 于 可 行 集中 一 个 解 x*" ， 如 果 找 不 到 一 个 
解 xeS 使 f(x)<f(x*")， 则 x" 称 为 非 劣 解 。 

非 劣 解 也 称 有 效 解 ， 或 Pareto 最 优 解 (Pareto Optimal) 。 非 劣 解 表 
明 ， 在 可 行 集中 再 找 不 到 一 个 解 比 它 更 好 。 就 是 说 ， 找 不 到 一 个 可 行 解 
x, BB f(x) = (f(x)，…,f,(x))" 的 每 一 个 目标 都 不 比 f(x*) = 
CAG), LOO) "的 相应 目标 坏 ,并且 f(x) 至 少 有 一 个 目标 值 要 
比 f(x" ) 的 相应 目标 值 好 。 

一 般 非 劣 解 不 止 一 个 ， 非 劣 解 的 集合 称 为 非 劣 解 集 ， 用 X“ RR 
非 劣 解 相应 的 目标 向 量 称 为 非 支配 目标 向 量 。 由 所 有 非 支配 目标 向 量 构 
成 多 目标 问题 的 非 劣 最 优 目 标 域 。 

遗传 算法 正 越 来 越 多 地 被 应 用 于 解决 多 目标 问题 ， 遗 传 算法 种 群 进 
化 特征 使 其 适合 于 这 样 的 问题 。 处 理 多 目标 问题 时 ， 遗 传 算法 遇 到 的 一 
个 主要 问题 是 如 何 根据 多 个 目标 函数 值 来 确定 个 体 的 适应 值 ， 即 适应 值 
分 配 机 制 。 基 本 的 处 理 方法 包括 以 下 几 种 。 

1. 向 量 评价 方法 

采用 向 量 形式 评价 的 适应 值 度量 来 产生 下 一 代 ， 而 不 是 使 用 标量 适 
应 值 度量 方式 来 评价 染色 体 。 对 于 由 9 个 目标 的 给 定 问题 ， 每 代 中 的 选 
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择 过 程 是 一 个 循环 ， 它 重复 9 次 ， 每 次 循环 依次 使 用 一 个 目标 ， 每 次 循 
环 使 用 这 个 目标 选 出 下 一 代 中 的 一 部 分 个 体 。 

2. 权重 和 方法 

该 方法 为 每 个 目标 函数 分 配 权 重 并 将 权重 目标 组 合 为 单一 目标 函 
数 。 只 需要 合适 的 权重 就 可 以 实现 该 方法 。 权 重 的 调整 方法 包括 : 固定 
权重 方法 ; 随机 权重 方法 ; 适应 性 权重 方法 等 。 

3. 基于 Pareto 的 方法 

有 两 种 基于 Pareto 的 方法 : Pareto 排序 和 Pareto 竞争 。Pareto 基于 
排序 的 适应 值 分 配方 法 是 希望 对 所 有 Pareto 个 体 分 配 相同 的 复制 概率 。 
它 主要 包括 两 个 主要 步骤 : 

(1) 基于 Pareto 排序 对 种 群 进行 分 类 。 

(2) 根据 排序 对 个 体 分配 选 择 概率 。 

Pareto 竞争 方法 中 采用 了 小 生境 Pareto 概念 ， 而 不 是 非 支配 分 类 和 
排序 选择 。 小 生境 Pareto 指 的 是 具有 最 小 邻居 数量 的 Pareto 解 赢得 
竞争 。 

4. 妥协 方法 

妥协 方法 是 通过 某 种 距离 的 度量 来 确定 与 理想 解 最 近 的 解 。 为 了 克 
服 找 理想 点 的 困难 ， 也 可 以 使 用 部 分 已 经 探索 的 解 空 间 中 的 代理 理想 点 
来 替代 整个 解 空 间 的 理想 点 。 

S. 目标 规划 方法 

该 方法 是 采用 基于 排序 的 适应 值 分 配方 法 来 判断 个 体 的 价值 。 具 体 
过 程 为 : 根据 第 一 优先 目标 进行 种 群 排序 ， 如 果 某 些 个 体 具 有 相同 的 目 
标 值 ， 根 据 第 二 优先 目标 进行 排序 ， 如 此 进行 下 去 。 如 果 各 个 目标 上 各 
个 个 体 均 相同 ， 则 随机 对 其 进行 排序 。 然 后 采用 从 最 好 到 最 差 的 指数 插 
值 进 行 个 体 的 适应 值 分 配 。 

上 述 内 容 是 对 多 目标 处 理 方法 的 一 个 概述 ， 主 要 来 自 参考 文献 
[25], ， 欲 了解 详 细 内 容 可 以 查看 相关 参考 文献 。 


3.5 应 用 实例 


本 节 介 绍 遗 传 算法 的 一 些 应 用 实例 。 主 要 包括 三 个 经 典 的 运筹 学 问题 : 
背包 问题 、 最 小 生成 树 问题 和 二 次 指派 问题 ， 以 及 一 个 实际 的 应 用 问题 ; 
企业 动态 联盟 中 的 伙伴 挑选 问题 。 解 决 背包 问题 ， 主 要 是 说 明 遗 传 算法 如 
何 来 处 理 约束 ; 对 于 最 小 生成 树 问题 ， 主 要 是 说 明和 遗传 算法 中 合适 的 编码 
方法 对 于 问题 表达 的 重要 性 ;而 遗传 算法 对 二 次 指派 问题 的 处 理 可 以 看 到 


56 第 3 章 遗传 算法 


合适 的 编码 方法 能 够 有 效 地 消除 数学 模型 中 的 约束 ; 最 后 详细 介绍 企业 
动态 联盟 中 的 伙伴 挑选 问题 模型 ， 给 出 了 模型 简化 与 编码 方案 , 使 用 了 
嵌入 模糊 规则 的 遗传 算法 来 求解 ， 并 给 出 了 计算 过 程 的 详细 数据 。 


3.5.1 背包 问题 


1. 问题 的 提出 

背包 问题 (Knapsacks Problem) 在 3.2.3 节 中 已 经 描述 ， 这 里 为 说 
明 方便 ， 重 复 如 下 : 

nn 个 物品 ， 对 物品 i， 价值 为 P ， 质 量 为 w,， 背 包容 量 为 WW。 如 何 
选取 物品 装 人 背包 ， 使 背包 中 的 物品 的 总 价值 最 大 。 

从 实践 的 角度 看 ， 该 问题 可 以 表述 成 许多 工业 场合 的 应 用 ， 如 资本 
预算 、 货 物 装载 和 存储 分 配 等 问题 。 背 包 问 题 是 NPOERE, BATA 


传 算法 来 求解 。 
2. 数学 模型 
背包 问题 可 以 用 数学 模型 描述 为 
max Y »* (3.15.1) 
fi 
s.t > us <W (3.15.2) 
x,=0,1 1<i<n (3. 15.3) 
上 面 的 模型 中 采用 了 二 进 制 编码 方法 。 定 义 如 下 
„ [D EAR I (3.16) 
d le 不 装 入 物品 i 
3. 约束 的 处 理 


但 是 对 于 这 样 的 编码 方法 来 说 ， 必 须要 面 对 如 何 保持 可 行 性 的 问 
题 。 例 如 ， 对 于 一 个 7 个 项 目的 背包 问题 ,背包 容量 为 W=100， 具体 
数据 见 表 3.3。 考 察 如 下 编码 

X-(1100110) 
这 表示 项 目 1、2、5 和 6 被 装 人 了 背包 ， 经 过 计算 可 知 产生 的 解 不 可 行 。 
表 3.3 背包 问题 示例 


i 1 2 3 4 5 6 T 


w, 40 50 30 10 10 40 30 


Pi/ Ww, 1 1.2 0.33 1 0.3 0.5 2 
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当 出现 如 上 情况 时 ， 应 该 采取 适当 的 策略 来 进行 处 理 。 下 面 将 分 别 
采用 惩罚 策略 、 解 码 法 和 顺序 编码 的 方法 来 处 理 上 面 的 背包 问题 。 
(1) 罚 函 数 法 


定义 适 值 函数 为 
F(x) e f(x) P(x) (3.17) 
其 中 , Kx) 为 目标 函数 ; P(x) 为 罚 函 数 。 
令 
Poe 
Pa t= (3. 18) 
其 中 
8=max{W,| Y w, - w |} (3.19) 


BR, X-(00-0) RH, 82V; SXc(11-1) i, ô= 
[Zewo mrm|X«-w | 是 | X«x-v | 的 两 个 端点 。 所 
f 名 € 
以 上 述 适 值 函 数 设置 的 意义 如 下 : 

Os 的 作用 是 为 了 使 0< | Y wx -多 |< 5 成立， 保证 了 0 < 
P(x) <1。 

OPa) 可 行 也 惩罚 ， 只 有 当 | E wn -W| =0 时 不 惩罚 。 

@@ 罚 函数 的 目的 是 将 解 拉 向 边界 ， 尽 量 装 满 。 

(2) 解码 法 

解码 法 是 一 段 修复 程序 ， 将 不 合法 的 编码 修复 为 合法 编码 。 其 具体 
步骤 如 下 : 


@ 将 选 上 的 物品 按照 中 降 序 排列 。 
@ 按 照 优先 适合 启发 式 First Fit Heuristic) 选择 物品 装 人 背包 


上 m 
即 选 前 天 个 物品 ， 使 得 PLA E24 ZU å 
例如 对 于 表 3. 3 中 所 示 背 包 问 题 ， 如 下 编码 
X=(1100110) 
不 可 行 。 
考察 该 编码 ， 被 选 上 的 物品 为 1，2，5，6。 
将 这 些 物品 降序 排列 为 2，1，6，5。 


AA w, +w, <W<w,+w, w, 
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所 以 修复 为 
X-(1100000) 

(3) 顺序 编码 方法 

使 用 顺序 编码 也 可 以 解决 背包 问题 ， 即 对 于 n 个 问题 的 背包 问题 ， 
EFI n 个 不 同 的 正 整 数 代表 ”个 项 目 。 其 编码 步骤 为 : 

@ 随 机 产生 一 个 项 目 顺序 Ga, 12, =s xe 

@ 按 照 优先 适合 启发 式 来 选择 项 目 ， 即 保留 项 目 顺序 的 前 ”位 ， 使 
4 "t 
Ywa «Ws Y wx, ， 从 而 得 到 可 行 解 。 


1 f 
例如 对 于 表 3. 3 中 所 示 背 包 问 题 ， 随 机 产生 如 下 项 目 顺序 (3, 2, 
5,1,4,6, 7), 
因为 ws +w, +ws «Ww, +w, +w, +m, 
所 以 得 到 的 可 行 解 为 (3，2，5)。 
显然 顺序 编码 的 染色 体 ， 顺 序 不 同 的 时 候 ， 染 色 体 长 度 也 可 能 是 不 
同 的 ， 那么 对 于 编码 长 度 可 变 的 染色 体 如 何 进行 遗传 运算 呢 ? 
(xxn 
可 以 使 用 插入 交叉 来 进行 交叉 运算 。 其 步骤 如 下 : 
a. 在 第 一 个 父 代 已 上 随机 地 选择 一 个 断 点 。 
b. 在 第 二 个 父 代 P, 上 随机 选择 一 个 基因 片段 插入 P, 的 断 点 处 。 
c. 删 去 P, 上 的 重复 基因 。 
d. 按 优先 适合 启发 式 得 到 可 行 解 。 
图 3. 27 为 插入 交叉 的 示意 图 。 


P=12l46135 


X、Y 之 间 为 基因 片段 Q 


选 $ 时 超重 ， 去 掉 5 SA 
32461 «c 32,46, 15 


图 3.27 插入 交叉 示意 图 


加 变异 运算 
对 变 长 的 顺序 编码 进行 变异 操作 可 以 采用 如 下 步骤 : 
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a. 随机 删除 一 个 基因 。 

b. 在 染色 体 中 随机 插入 一 个 没有 的 基因 。 

c. 对 于 以 上 原始 后 代用 优先 适合 启发 式 方法 产生 一 个 可 行 解 。 

对 于 二 进 制 编码 来 说 ，7 个 项 目的 背包 问题 共有 编码 2”= 128 个 ， 
这 与 解 空间 是 一 一 对 应 的 ， 但 是 不 能 保证 解 的 可 行 性 ; 对 于 变 长 顺序 编 
码 来 说 ， 其 初始 编码 〈 即 随机 产生 的 项 目 顺 序 ) 共有 7! =5 040 个 ， 与 
解 空间 不 是 一 一 对 应 的 ， 但 是 能 够 保证 解 的 可 行 性 。 


3.5.2. 最 小 生成 树 问题 


最 小 生成 树 (Minimum Spanning Tree) 问题 是 个 经 典 的 组 合 优化 问 
题 ， 这 里 首先 描述 最 小 生成 树 问 题 ， 然 后 介绍 传统 的 编码 方法 ， 之 后 重 
点 介绍 Prüfer 数 编码 的 遗传 算法 来 求解 最 小 生成 树 问题 。 

1. 问题 的 提出 

为 描述 最 小 生成 树 问题 ， 先 来 说 明 相关 的 基本 概念 。 

定义 3.5.1 (A): 一 个 图 是 由 点 集 V= |v) 和 VV 中 元 素 的 无 序 对 
的 一 个 集合 E= |e,i 所 构成 的 二 元 组 ， 记 为 G= (VY, E), V 中 的 元 素 
叫做 节点 或 端点 ，E LIES XA CM 

定义 3.5.2 (W): 连通 且 不 含有 回路 的 图 称 为 树 。 

定义 3.5.3 (生成 树 ) : 若 图 G 的 生成 子 图 是 一 棵 树 ， 则 称 该 树 为 
C 的 生成 树 。 节 点 的 度 是 和 该 节点 相连 的 边 的 数量 。 只 有 一 条 边 相 连 的 
节点 称 为 叶子 。 显 然 叶 子 的 度数 为 1。 

树 是 图 论 中 结构 最 简单 但 又 十 分 重要 的 图 ， 在 自然 科学 和 社会 科学 
的 许多 领域 都 有 广泛 的 应 用 。 

定义 3.5.4 (最 小 生成 树 ) : 连通 图 C = (V,，E)， 每 条 边 上 有 非 负 
权 ， 一 棵 树 生成 树 所 有 边 上 权 的 和 称 为 这 个 生成 树 的 权 ， 具 有 最 小 权 的 
生成 树 称 为 最 小 生成 树 。 

图 3. 28 就 是 一 个 图 和 树 的 示意 图 。 所 有 的 节点 和 边 构成 了 一 个 图 。 

2 3 


5 6 


图 3.28 图 和 树 的 示意 图 
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粗 体 的 数字 为 节点 ， 细 体 的 数字 为 边 。 其 中 粗 线 所 示 的 边 及 其 所 连接 的 
节点 构成 了 图 的 一 棵 生成 树 。 对 于 这 棵 生成 树 来 说 ， 叶 子 节点 为 1、3、 
4 和 5。 为 了 找到 图 的 最 小 生成 树 ， 首 先 需 要 对 树 进行 编码 。 

2. 传统 的 编码 方法 

首先 来 介绍 传统 的 编码 方法 : 节点 编码 方法 和 边 编码 方法 。 

(1) 节点 编码 

使 用 树 的 节点 的 编码 来 表示 树 。 例 如 ， 对 于 图 3.28 所 示 的 树 ， 可 
以 表示 为 

10,2), (2, 3), (2, 5, (2, 6), (4, 61 

(2) 边 编码 

使 用 边 的 编码 来 表示 树 。 例 如 ， 对 于 图 3. 28 所 示 的 树 ， 可 以 表 
示 为 

11, 2, 4, 5, 10} 

以 上 两 种 表示 方法 本 质 上 都 是 直观 地 用 边 来 表示 一 棵 生成 树 (第 
一 种 方法 是 用 节点 来 表示 树 的 边 ， 进 而 来 表示 树 )。 对 于 一 个 n 节 点 的 
图 ， 树 是 连接 这 n 个 节点 的 无 回路 的 具有 n -1 条 边 的 子 图 ， 而 上 面 的 
编码 方法 很 难 避 免 回路 ， 并 且 很 难 做 遗传 运算 。 

3. Prüfer 数 编码 

为 了 解决 以 上 问题 ， 有 人 提出 了 Prüfer 数 的 编码 方法 。 

(1) 定义 

Hn — 2 位 自然 数 唯一 地 表达 出 一 棵 nn 个 节点 的 生成 树 ， 其 中 每 个 
数字 在 1 和 n 之 间 。 这 样 的 一 个 排列 称 为 Prüfer 数 。 使 用 Prüfer 数 表示 
一 棵 树 ， 交 叉 变 异 后 还 是 一 棵 树 。Prifer 数 编码 本 质 上 也 是 节点 编码 的 
一 种 。 

(2) 应 用 条 件 

Prüfer 数 来 表达 生成 树 能 够 满足 生成 树 的 要 求 : 

四 覆盖 所 有 节点 。 

@ 所 有 节点 是 连通 的 。 

图 没有 回路 。 

(3) 编码 步骤 

编码 步骤 如 下 : 

@ 设 节点 i 是 标号 最 小 的 叶子 。 

OFA (G, j) 在 树 上 ， 则 令 j 是 编码 中 的 第 一 个 数字 (编码 顺序 
从 左 到 右 ) 。 

图 删 去 边 G,)). 
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图 转 到 中， 直到 剩 下 一 条 边 为 止 。 
对 于 图 3. 28 中 粗 线 所 表示 的 生成 树 可 以 使 用 上 述 步骤 进行 编码 ， 
过 程 如 图 3. 29 所 示 ， 得 到 的 Prüfer 数 编码 为 (2，2，6，2) 。 


1 E A4 E | S /4 


i, (P12), F2 3, (,](,2) j=2 
Dx á Paa 
5 6 5 6 

#5, (,0452),22 int, (4,6), j=6 


DW 


hs! 


6 
剩余 一 条 边 
图 3. 29 Prüfer 数 编码 示意 图 

(4) 解码 步 又 

解码 的 步骤 如 下 : 

DG Prüfer 数 中 的 节点 集 为 P， 不 包含 在 P 中 的 节点 集 为 Po 

QE i 为 P 中 最 小 标号 的 节点 , j 为 P 中 最 左边 的 数字 ， 连 接 边 
(i, 站， 并 从 万 中 去 掉 i， 从 P 中 去 掉 j， 若 j 不 再 在 P 中 ,将 j 加 入 PP 
中 。 

ORAO, HAP 中 没有 节点 ( 即 P 为 空 ),，P 中 正好 剩 下 (s， 
r) 两 个 元 素 。 

@ 连 接 (s, r)o 

图 3.30 AREER Prüfer 数 的 解码 过 程 示 意图 ， 以 刚才 得 到 的 编 
码 (2,2, 6, 2) 为 例 。 

(5) 优点 

Prüfer 数 本 质 上 也 是 一 种 节点 编码 方法 ， 它 是 最 小 生成 树 问题 的 最 
合适 的 编码 方法 。 因 为 对 于 n 个 节点 的 图 来 说 ,其 生成 树 的 个 数 为 
n'7^, Hj Prüfer 数 的 个 数 也 为 n"“。Prifer 数 编码 实现 了 解 空间 和 编码 
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$ 2 
1 4 > T4 4 
5 6 5 6 
P-0,2,6,2) 
T-(01,2.45) (1,2), P-Q, 6, 2), PG, 4, 5) 


Q 
1 Z^ < 14 4 


5 6 5 6 


4,6), P=2), P-GS, 6) 3,2), P-(6, 2), P-(4, 5) 
2 J 3 2 3 
17 Wa 4 E 14 "" 74 
5 6 5 6 
(52), P-2,P-(62) 连接 (6,2) 


图 3.30 Prüfer 数 编码 示意 图 
空间 的 一 一 对 应 ， 并 且 交 叉 和 变异 运算 不 破坏 编码 的 合法 性 。 从 此 例 可 
以 看 到 ， 一 个 好 的 编码 对 于 遗传 算法 至 关 重 要 。 
Prüfer 数 编码 的 遗传 算法 可 以 使 用 前 述 的 交叉 和 变异 方法 ， 如 简单 
的 单 点 交叉 和 随机 变异 即 可 ， 这 里 不 再 详 述 。 


3.5.3 二 次 指派 问题 


在 3.2.3 节 中 已 经 介绍 了 一 维 指派 问题 。 这 里 来 介绍 二 次 指派 问题 
(Quadratic Assignment Problem, QAP) 及 其 遗传 算法 的 求解 。 

1. 问题 的 提出 

最 早 是 将 机 器 布局 (Facility Layout) 问题 建 模 为 二 次 指派 问题 ， 
所 以 在 描述 二 次 指派 问题 时 ， 常 常 以 机 器 布局 问题 为 例 。 该 问题 可 描述 
WF: 

n 台 机 器 要 布置 在 n MAT, WRR i E Zr (LOU CR fa, E 
与 1 之 间 的 距离 为 4,， 如 何 布置 使 费用 最 小 。 

二 次 指派 问题 也 可 以 被 用 做 许多 其 他 不 同 的 实际 问题 的 模型 ， 如 大 
学 校园 中 的 建筑 物 的 布局 、 医 院 中 科室 的 安排 、 电 子 电路 中 的 最 短 布线 
问题 ， 以 及 磁带 中 相关 数据 的 排序 问题 等 。 

2. 数学 模型 

用 0 -1 编码 的 变量 xs 来 表达 机 器 与 位 置 的 关系 如 下 : 
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S ed Ba» 
同 理 表示 xu。 则 该 问题 可 建立 二 次 0 -1 规划 模型 

min X » 2 Behad (3.21) 

DI X4 =1,Yj, j=1,2,=,n (3.22) 

Sty =1,Vi, iz12,-,n (3.23) 

j x, =0 或 1， Vi, j (3.24) 


二 次 指派 问题 是 TSP 问题 的 一 般 化 ， 也 是 一 个 NP 完全 问题 。 

3. 遗传 算法 求解 

(1) 编码 

可 以 使 用 顺序 编码 : Xo (n.o. cns x, 0n x) lsign 
其 中 ，x 表 示 机 器 x, 放 在 位 置 i,， x 为 1 到 n 的 整数 。 如 编码 

X=(4, 3, 1, 2, 5) 
表示 机 器 4 放 在 位 置 1; 机 器 3 放 在 位 置 2; 机 器 1 放 在 位 置 3; 机 器 2 
放 在 位 置 4; 机 器 S 放 在 位 置 5。 

该 编码 的 优点 是 没有 重复 ， 保 证 了 编码 的 合法 性 。 

(2) 目标 函数 表达 式 

使 用 上 面 的 编码 方式 ， 可 将 目标 函数 简化 为 


min X È fads (3.25) 
显然 ， 目 标 函 数 变 得 更 加 简洁 ， 更 加 便于 计算 。 但 是 ， 也 导致 了 变 
量 出 现在 下 标 ， 任 何 数学 规划 不 可 用 ， 而 这 正 适 合 于 使 用 遗传 算法 来 
求解 。 
(3) 适 值 标定 与 遗传 运算 
可 以 采用 下 面 的 动态 线性 标定 方式 
F(x) =kU f(x) ] "t (3.26) 
其 中 ,k 取 10"。 
选择 策略 使 用 正比 选择 。 遗 传 运算 可 以 使 用 循环 交叉 操作 ， 变 异 采 
用 换 位 变异 。 


3.5.4 企业 动态 联盟 中 的 伙伴 挑选 问题 
伙伴 企业 的 挑选 是 敏捷 制造 和 供应 链 管理 中 的 一 个 热点 问题 。 这 里 
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将 以 该 问题 为 例 ， 详 细 介 绍 一 个 嵌入 模糊 规则 的 遗传 算法 的 具体 实现 ， 
对 伙伴 挑选 问题 该 算法 能 够 得 到 满意 的 结果 。 

首先 将 伙伴 挑选 问题 表达 为 带 有 非 解析 目标 函数 的 0-1 整数 规划 
模型 ， 通 过 定义 无 效 候选 人 缩小 搜索 空间 ， 采 用 模糊 规则 量化 的 方法 将 
模糊 决策 嵌入 到 项 目 调度 算法 中 ， 从 而 形成 一 个 模糊 决策 与 遗传 算法 结 
合 的 计算 方法 。 和 传统 的 优化 方法 对 比 ， 嵌 入 模糊 规则 的 遗传 算法 能 够 
以 很 大 的 概率 快速 找到 最 优 解 。 

1. 问题 的 提出 

设 某 企业 赢得 一 个 由 多 个 项 目 组 成 的 大 工程 的 标书 。 它 本 身 的 能 力 
和 资源 不 足以 完成 整个 工程 ， 因 此 它 必 须 对 项 目 进 行 招标 。 或 者 ， 该 企 
业 本 身 就 是 个 虚拟 企业 ， 赢 得 标书 再 分 发 出 去 ， 从 而 赚 取 差额 正 是 它 的 
运作 方式 。 

设 工程 由 ”个 项 目 组 成 ， 这 些 项 目 由 先后 衔接 关系 构成 了 一 个 活动 
Niko HWE k REENE i 完成 后 开始 ， 即 项 目 i 领先 于 k， 则 用 二 
元 关系 (i, k) eH 表示， 这 里 ， 昌 为 所 有 衔接 关系 的 集合 。 为 描述 方 
便 ， 在 标定 项 目 时 ,使 得 i<k，V (i, k) e 瑟 成 立 。 不 失 一 般 性 ， 将 最 
后 一 个 项 目标 定 为 mn。 如 最 后 项 目 不 能 确定 ， 可 定义 一 个 虚拟 的 最 后 项 
目 。 工 程 的 投资 流 为 e(t) 20, t=1, 2, =, D, HPD 为 工程 的 交工 
期 。 若 工程 拖 期 ， 盟 主将 承受 单位 时 间 拖 期 惩罚 Be 

MPM i, i=1, 2, =, n, H m, 个 候选 人 应 标 。 项 目 i 的 候选 
Aj 的 投标 价格 为 b;,， 施 工 周 期 为 9,。 盟 主 对 项 目的 付款 方式 为 开工 时 
付 ab,，(0<a<1)， 完 工时 再 付 剩余 的 《1 - a)by。 出 现 资金 短缺 时 ， 
盟主 可 以 利率 r>0 向 银行 借贷 。 

盟主 的 目标 是 选择 最 好 的 伙伴 组 合 ， 使 由 项 目 开支 、 拖 期 惩罚 和 银 
行 利 息 三 者 构成 的 总 费用 达到 最 小 。 


2. 数学 模型 
定义 变量 
ee ga sa (3.27) 
0, 其 他 


于 是 ， AAP ARA: 
min,Z(w) = pp X« a) +S Le > 5 inet (7) + 


ff 


ü-9» > X ono ca) - X e(r) 1+ le, - D* 


fa 


(3. 28) 
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st Y Ye) dida (3.29) 


m 
Mi en mu en 


(e+ qy)wy(t) < Y Y twy(t), Y (i,k) e H (3.30) 


mi mi mm 


SS (et ay)wg(t) = ey (3.31) 
w(t) = 180, V i,j,t (3.32) 


其 中 ，%, 是 最 后 项 目的 完成 时 间 ; [x] “表示 max 10, x]. 

由 于 模型 [ (3.28) ~ (3.32)] 中 的 目标 函数 是 非 连续 可 微 的 ， 不 
能 用 一 般 的 数学 规划 的 方法 来 求解 。 

3. 存在 规则 解 的 充分 条 件 

虽然 目标 函数 (3.28) 中 没有 提前 惩罚 项 ， 由 于 借贷 利息 的 限制 
作用 问题 一 般 是 提前 / 拖 期 型 的 ， 但 是 ， 如 果 拖 期 惩罚 因子 B 过 小 ， 工 
程 会 尽量 拖 期 以 避免 任何 借贷 发 生 ， 因 此 ， 首 先 要 考虑 问题 存在 规则 解 
的 条 件 。 

定义 3.5.5: 若 问题 [ (3.28) ~ (3.32)] 的 目标 函数 是 提前 / 拖 期 
惩罚 型 的 ， 则 称 其 解 为 规则 解 。 


D 


设 工程 的 总 投资 为 E,E = X elt) 问题 [ (3.28) ~ (3.32) ] 存在 


规则 解 的 充分 条 件 由 定理 3. 5. 1 给 出 。 

定理 3.5.1: 若 B> 史 ， 则 伙伴 挑选 问题 [ (3.28) ~ (3.32) ] 存在 
规则 解 。 

证 明 : 为 简化 描述 ， 设 c =1。 目 标 函数 Z(w) 简化 为 

Zw) = Y Y b Y w(t) + 


eim 6 


P > p 5 byw (7) = X«I» + Ble, DIS 
Bew(t), t=1, 2, =, AEA [ (3.28) ~ (3.32)] 的 解 ， 而 
w(t+1) =w(t), t=1, 2, =, c, JÉB w(t) 延期 一 个 单位 时 间 的 解 。 
BR, w(t) WEAR [ (3.29) ~ (3.32)] 且 c,=c, +1。 两 个 解 的 目 
标 值 的 差 为 


Z(w) - Z(w) = SI 5 D Yo - YXe«p- 
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Ale, -D]'-Blc, - D' 
2 SI > 5 X hon) - X«r- 


zi fi 


p 
LE 


TY LS Y Xe - X«or. 


io Rer 


Ble, - D - ple, - De 1] 
= SLY $ Yaa - Sel- 


£f i 


SI > 5 Y bye) - X«or * 
Ble, - D]'- ple, - D« 1]* 
注意 到 ws(0) 20, Vi, j， 可 删 去 :=0 时 的 第 二 个 [，]”， 因 为 
e(1) >=0， 其 值 必 为 零 。 


定义 y(D = Y Y Y bw) - Delt) , BA 


Z(w) - Z(w) =r5 tly) +elt+1)]*- [y(t 1") 


+Ble, -D]*-Ble,-D+1]* 
情况 1: c <D。 
B[c,-D]*=B[c, -D+1]* =0, WA, Z(w) -Z(w) 20, AW 
[y(t) «ecc D]! 20(001* Vee 
情况 2: c, SD. 


Zw) -Z(9) =r Y D) «eG DI- DO] -8 


eI <E- B<0 


定理 3. 5. 1 是 符合 实际 的 。 对 于 投资 者 来 说 ， 单 位 时 间 内 的 工程 利 
润 至 少 应 大 于 总 投资 的 利息 ， 而 拖 期 惩罚 显然 也 应 大 于 利润 。 因 此 ， 定 
理 3.5.1 对 于 实际 问题 是 能 够 满足 的 。 

4. 模型 简化 与 编码 方案 

问题 [ (3.28) ~ (3.32) ] 的 解 空间 的 大 小 ， 即 存在 解 的 数量 N 
为 


N = Tm (3.33) 
显然 ， 即 使 对 于 小 规模 问题 这 个 空间 也 十 分 大 。 例 如 ， 对 于 一 个 
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20 个 项 目 每 个 项 目 有 5 个 候选 人 的 问题 ，N =9. 536 7 x 10", 

定义 3.5.6: 项 目 i 的 候选 人 j 是 无 效 的， 如 果 存 在 i 的 男 一 个 候选 
Ak, A bu mb, qu < qs 或 者 ba «bu. qa Sayo 

定理 3.5.2: 若 问题 [ (3.28) ~ (3.32) ] 存在 规则 解 ， 则 至 少 存 
在 一 个 不 含 无 效 候选 人 的 最 优 解 。 

证 明 : 假设 w(t) ,t=1，2,…，c,， 是 问题 的 最 优 解 ， 其 中 项 目 
i 选择 了 无 效 候选 人 j。 由 定义 3.5.6， 必 存在 i 的 另 一 个 候选 人 满足 
b, sb, qu <I RA ba <5, qa que 

将 解 w'(t) 中 项 目 i 的 承包 人 j 换 为 上 得 到 一 个 新 的 解 w(t)，t= 
1，2，…，c,。 容易 证 明 只 要 问题 的 目标 函数 是 提前 / 拖 期 惩罚 型 的 ， 
WAR Z(w)«Z(w). 

Wit, w(t), t=1, 2, =, c, BERRE. 

按照 定理 3. 5.2， 求 解 中 可 以 忽略 所 有 无 效 候选 人 ， 而 不 会 丢失 最 
优 解 。 这 样 ， 解 空间 可 以 大 大 简化 。 

对 所 有 项 目 i 将 所 有 候选 人 按 投标 价格 从 低 到 高 排序 ， 即 


ba <ba < «b, i m1,2,,n (3.34) 
删 去 无 效 候选 人 后 ， 有 
qa >a > > Gm rb = 12,07 (3.35) 


ik: 按 定义 3.5.6， 在 所 有 候选 人 对 中 已 不 存在 价格 和 时 间 二 者 之 
一 相等 的 情况 ， 而 二 者 全 等 的 候选 人 对 在 模型 中 不 能 区 分 。 因 此 ， 式 
(3.34) 和 (3.35) 是 严格 不 等 式 。 

遗传 算法 的 染色 体 采用 自然 数 编码 方法 ， 设 染色 体 x = [x,, 
xoc. ox), UP eel Alm, Vi PW ARM, ROMA i 选择 候选 
Axo = [x 3, 7o, x,] 也 称 为 一 个 选择 。 例 如 ，[3 2 5 1 
4 1 6 2] 是 一 个 8 项目 问题 的 染色 体 ， 或 一 个 选择 。 其 中 ， 项 目 
1 选择 候选 人 3， 项 目 2 选择 候选 人 2， 项 目 3 选择 候选 人 5， 以 此 类 
推 。 

4 s(x) Mela) 分 别 为 选择 x 中 项 目 i 的 开工 和 完工 时 间 ， 模 型 
[(3.28) ~ (3.32)] 可 简化 为 


DI D 


min, Z(x) = DOC b, (072) Y b - Sen] + 
A A i ales 


Ble,(x) - D)* (3.36) 

s.t. ci(z) &s,(x) , V (i,k) e H, (3.37) 

x, 是 1 和 m, 之 间 的 整数 ，i=1，2，…， (3.38) 

模型 [(3.36) ~ (3.38) ] 比 原 问题 大 为 简化 ,但 下 标 中 含有 变量 ， 
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这 对 一 般 数学 规划 方法 是 无 法 处 理 的 , 但 对 遗传 算法 来 说 并 不 十 分 
困难 。 

对 于 一 对 选择 x 和 y，x >y 表示 y, Vi, HEDREL 和 nm 之 
闻 的 一 个 大 使 得 x, >y; 成 立 。 定 义 选择 x 的 净值 ，Y(*) ， 为 所 有 项 目 费 
和 借贷 利息 的 和 ， 即 

V(x) 2Z(x) -Ble, -D]* (3.39) 
即 拖 期 惩罚 不 包含 在 净值 中 。 再 定义 项 目 i 取 候 选 人 h 时 的 费用 和 工期 
的 增 量 Aba 和 Aqu, OS 
Ab, 2b, 一 ba， h=1, 2，…，mi-1，i=1，2，…，P 
Ada 74a. Ias h=1, 2, +, m,-1, i21, 2, |, n 
由 不 等 式 (3.34) 和 (3.35) ， 显 然 有 Ab, >0 HI Aga <0, Vi, ho 
定理 3. 5.3: 对 于 一 对 选择 x 和 7y， 且 x>y， 则 有 c, (x) &c, GO RI 
V(x) zV(y), RE 
Ab, +rbaAga>0, Vi, h (3.40) 

ER: 设 ** 和 x' 是 一 对 选择 ,满足 x** >x' 且 x? -1=xi =h 仅 对 i 成 
x, 而 x* =x'，Vk#i。 

由 于 总 完工 期 cv(x*) 是 活动 网 络 的 关键 路 径 上 所 有 项 目 工期 的 和 ， 
所 以 

(D 由 于 gu <Ja 容易 证 明 必 有 : (e) <e), KWH i 
在 x' 或 < 的 关键 路 径 上 时 不 等 号 成 立 。 

(2) 由 于 x' 比 x 最 大 可 能 的 提前 是 qu - qu, ， 而 最 大 可 能 多 借 
RHAL rba (a-da) TÆR 

V(x!) ~- V(x) Sba -biren *rba(qa -iasi ) = 7 Aba 7 rba Aga <O 

因此 ， 定 理 对 x** >r RE. Aar =y 开始 ， 对 各 项 目 逐 次 加 1， 记 
Axe, HB? =x 为 止 ， 于 是 定理 得 证 。 

由 于 -通常 较 小 ， 条 件 (3.40) 对 绝 大 多 数 实际 问题 是 容易 满足 
的 。 定 理 3. 5. 3 为 算法 中 模糊 规则 成 立 的 必要 条 件 。 

一 旦 当前 选择 x 选 定 了 所 有 项 目的 候选 人 ， 可 用 关键 路 径 法 
(CPM) 来 做 项 目 调度 。CPM 除 可 以 获得 当前 选择 的 目标 值 外 ， 还 能 找 
出 工程 的 所 有 关键 工作 和 非 关 键 工作 。 注 意 ， 由 于 候选 人 的 工期 不 同 ， 
选择 关键 路 径 也 不 同 。 

5. 媒 入 模糊 决策 的 遗传 算法 

肉 入 模糊 决策 的 遗传 算法 的 基本 思想 是 在 算法 的 第 一 级 用 遗传 算法 
选择 伙伴 组 合 ， 而 在 第 二 级 用 模糊 决策 方法 对 选 定 的 组 合 进行 改进 。 
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模糊 决策 的 基本 思想 是 : 根据 人 的 经 验 ， 当 选择 组 合 造成 工程 拖 期 
时 ， 对 关键 路 径 上 的 项 目 选 标号 较 大 的 候选 人 ， 而 工程 费用 较 高 时 则 可 
将 非 关键 路 径 上 的 项 目 换 为 标号 较 小 的 候选 人 。 

本 节 遗 传 算法 的 编码 方案 如 前 所 述 ， 适 值 函 数 按 下 式 定义 

fü) =Z。 - ZU) +aj=1,2,…,NP 

其 中 ，NP 是 种 群 大 小 ; Z。.。 = max 0Z(xG)), j=1, 2, +, NPL 为 
种 群 中 的 最 大 目标 值 ; a 是 一 个 动态 调节 选择 压力 的 参数 ， 它 使 最 差 的 
染色 体 也 有 一 定 的 繁殖 机 会 。a 的 初 值 设 为 初始 种 群 中 的 最 大 目标 值 的 
5% ， 并 在 迭代 中 按 a0. 975a HEM. 

遗传 算 子 采 用 常用 的 双 切 点 交叉 和 换 值 变异 。 只 要 变异 更 换 的 值 仍 
在 [1, m] 中 选取 ， 这 两 种 遗传 运算 都 能 保持 解 的 合法 性 。 选 择 策略 
则 采用 了 常用 的 “ 旋 轮 ”正比 选择 ， 停 止 准则 为 达到 指定 的 最 大 代数 。 
算法 的 具体 步骤 见 文献 [17] 。 

6. 计算 结果 与 分 析 

下 面 介 绍 一 个 源 于 某 火 电站 建设 工程 的 项 目 发 标的 例子 〈 注 : 数 
据 作 了 处 理 ) 。 

该 工程 由 16 个 项 目 构成 。 交 工期 为 36 个 月 。 拖 期 一 个 月 的 惩罚 是 
48 百 万 元 。 项 目 费 的 支付 方式 为 开工 时 支付 65% ， 剩 余部 分 完工 时 支 
付 。 银 行 的 贷款 利息 是 月 息 0.6% 。 项 目 衔接 关系 如 图 3. 31 所 示 的 活 
动 网 络 图 。 


2-(E)-2 


图 3.31 “项目 衔接 关系 的 活动 网 络 图 
总 投资 为 485 百 万 元 。 由 于 0.006 x 485 <48， 问 题 有 规则 解 。 问 
题 的 解 空间 为 2. 787 x 10" ， 按 定理 3.5.2， 删 去 了 9 个 无 效 候选 人 后 ， 
解 空间 降 为 3. 359 x 10*。 余 下 的 候选 人 满足 条 件 式 (3. 40)。 
算法 获得 的 最 好 解 的 工程 总 价格 为 472. 484 2 百 万 元 ， 完 工期 为 36 
个 月 。 盟 主 企业 可 获 利 12. 52 百 万 元 。 对 比分 枝 定 界 法 取得 的 结果 ， 这 
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个 解 就 是 最 优 解 。 

为 测试 嵌入 模糊 决策 的 遗传 算法 (GA/FD) 的 性 能 ， 随 机 产生 若 
干 个 不 同 规模 的 问题 ， 并 分 别 用 (GA/FD)、 单 纯 的 遗传 算法 (GA) 
和 分 枝 定 界 算法 (B&B) 求解 ， 结 果 见 表 3.4。 表 中 , “规模 ”表示 问 
题 的 解 空间 的 大 小 ,“CPU 时 间 ” 表 示 每 次 运行 占用 CPU 的 时 间 。 

表 3.4 不 同 算法 的 性 能 对 比 
n 规模 算法 | CPU 时间 | 最 好 率 | 最 好 值 | 平均 值 | 最 差 什 
GA/FD| 14.55" 100% | 472.48 | 472.48 | 472.48 
16 |3.359 x10' | B&B 1.32" 100% | 472.48 | 472.48 | 472.48 
GA 8.82" 39% | 472.48 | 473.71 | 479.30 
GA/FD| 20.27" 100% | 678.42 | 678.42 | 678.42 
22 |1.088 x10"| B&B 15.71" 100% | 678.42 | 678.42 | 678.42 
GA 11.99" 21% | 678.42 | 682.03 | 694.10 
GA/FD| 22.54" 100% | 917.68 | 917.68 | 917.68 
27 |9.404 x10^| B&B 14.61" 100% | 917.68 | 917.68 | 917.68 
GA 13.39" 2% | 918.67 | 928.22 | 940.85 
GA/FD| 26.24" 100% |1010.65|1010.65| 1010.65 
30 2.257 x10"| B&B 30.87" 100% |1010.65|1010.65| 1010.65 
GA 15.16" 3%  |1010.65|1020.46| 1036.55 
GA/FD| 31.99" sow |1362.47|1362.83| 1366.14 
38 |3.510 x10"| B&B | 458.47" | 100% |1362.47|1362.47| 1362.47 
GA 18. 29" 1%  |1362.47|1375.34| 1388.98 
GA/FD| 40.52" 789; |1636.07|1636.55| 1639.91 
48 |4.912 x10?| B&B | 42 457.73" | 100% |1636.07|1636.07| 1 636.07 
GA 22. 88" 1%  |1639.55|1659.86| 1682.51 
49.31" 70% |1870.85|1871.61| 1 883.47 
60 |9. 168 x10"| B&B | 142 937.01"| 100% |1 870.85)1 870.85] 1 870.85 
[pee 27.61" | 1% |1899.27|1920.80| 1 946. 12 

由 表 3.4 YL, MEORE I Ha HH. HA BY 
入 模糊 决策 的 遗传 算法 能 以 较 大 的 概率 获得 最 优 解 ， 且 计算 时 间 随 规模 
增加 的 增加 量 不 大 。 分 枝 定 界 法 能 确保 最 优 解 ， 但 对 大 规模 问题 计算 时 
间 太 长 。 纯 遗传 算法 虽 也 能 解 大 型 问题 ， 但 一 般 很 难得 到 最 优 解 。 以 上 
比较 说 明 模糊 决策 能 够 有 效 地 改进 复杂 优化 问题 的 计算 性 能 。 

7. 结论 

从 上 面 的 结果 可 以 看 到 ， 舱 入 模糊 决策 的 遗传 算法 能 以 大 的 概率 较 
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快 地 取得 企业 动态 结盟 中 的 伙伴 挑选 问题 的 最 优 解 。 比 起 纯 遗 传 算法 和 
分 枝 定 界 法 ， 它 在 计算 速度 和 达 优 率 两 方面 的 综合 性 能 更 好 。 


3.5.5 准时 化 生产 计划 的 半 无 限 规划 模型 


自从 准时 化 (IT). 生产 技术 获得 成 功 之 后 ， 以 准时 化 为 目标 的 提 
前 / 拖 期 生产 调度 问题 成 为 一 个 十 分 活路 的 研究 领域 。 为 了 准确 描述 准 
时 化 的 生产 计划 问题 ， 汪 定 伟 等 用 连续 时 间 函 数 来 描述 产品 对 制造 资源 
的 需求 ， 在 此 基础 上 建立 了 一 个 非 线性 的 半 无 限 规划 模型 ， 并 开发 出 一 
种 沿 梯度 方向 变异 的 遗传 算法 。 实 验 表 明 ， 当 种 群 规模 足够 大 时 ， 该 算 
法 能 够 以 很 大 的 概率 找到 最 优 解 。 

1. 问题 描述 及 半 无 限 规划 模型 

某 制造 系统 在 计划 期 [0, T] 内 接 到 项 订货 。 订 货 i 的 制造 周期 
EL, ZRI do BE x, 是 订货 i 计划 的 完成 时 间 ， 其 对 制造 资源 的 需 
求 是 依赖 于 *, 和 时 间 t 的 函数 ， 记 为 R(t1，%,)。 定 义 G(1) 是 + 时 刻 的 
资源 可 用 量 ，:e [0，7]。 按 JIT 思想 ， 计 划 的 生产 完成 时 间 应 尽 可 能 
靠近 交 货 期 。 于 是 ， 采 用 提前 / 拖 期 生产 调度 的 二 次 型 惩罚 函数 ， 该 问 


题 可 用 如 下 非 线性 的 半 无 限 规划 来 描述 。 
min Y a (s, - d)? G.41) 
(Si)sc Y Rs) € COste [OT]. — (42) 
0L «x, &T,i21,2,,n (3.43) 


其 中 ，a, 是 订货 i 的 权重 ,一般 正 比 于 订货 额 。 

由 于 :在 (0, T) PERRE, AER (3.42) 中 有 无 限 个 约束 。 
虽然 将 时 间 取 离散 值 可 将 该 问题 转化 为 一 个 普通 的 非 线性 规划 问题 ， 但 
当 离 散 点 较 多 时 约束 个 数 较 多 ， 计 算 十 分 复杂 。 相 反 ， 用 连续 时 间 函 数 
来 描述 资源 需求 和 拥有 量 时 ， 可 按照 文献 [18] 提出 的 非 精确 算法 ， 
利用 连续 函数 的 性 质 ， 只 将 资源 需求 函数 的 有 限 个 极 值 点 作 约 束 处 理 ， 
计算 反而 更 为 简便 。 

资源 需求 函数 可 以 根据 实际 情况 选取 ， 一般 可 以 取 为 钟 形 函 数 
( 正 态 分 布 密度 函数 ) B 

-(t-x b) 


R,(t,x,) = a,exp[ : 


设 p; 是 订货 i 的 总 资源 需求 ， 按 式 3.44) 中 函数 的 性 质 ， 其 参数 可 按 
FARE: 


] =12， (3.44) 


72 第 3 章 遗传 算法 


L, L j^ 
bape = ga HP a(g iea (3.45) 


假设 函数 (3.44) 的 两 个 标准 差 之 外 的 部 分 (小 于 3%) 可 以 忽略 
不 计 。 
资源 拥有 量 函 数 C(t) 一 般 可 用 指数 增长 函数 来 表示 。 由 于 设备 检 
修 或 其 他 任务 可 能 占用 部 分 资源 ， 这 些 已 占用 资源 可 用 类 似 (3.44) 
的 函数 表示 ， 并 从 总 资源 中 扣除 。 于 是 有 
(ent) 


CC) =&oexp(BD) - > qexp | -7 


其 中 ，%、&、 太 可 根据 检修 的 资源 占用 量 和 时 间 长 得， 类 似 于 式 
(3.45) 来 确定 。go 为 资源 的 初始 值 ，B 为 增长 率 。 

分 析 表 明 ， 由 于 每 一 对 订货 都 是 相互 竞争 资源 的 ， 在 资源 有 限 的 前 
提 下 ， 一 个 订货 占据 一 段 资 源 后 ， 另 一 个 订货 只 有 提前 或 者 拖 后 ， 因 此 
规划 (SIP) 的 可 行 域 一 般 是 不 连通 的 。 最 坏 情况 分 析 表 明 ， 对 于 n 个 


订货 问题 ， 可 行 域 可 能 由 2 7 个 分 离 的 区 域 构成 。 这 就 使 得 传统 的 优 
化 方法 很 难 应 用 ， 于 是 遗传 算法 便 成 为 优先 考虑 的 选择 。 

2. 沿 梯度 方向 变异 的 遗传 算法 

(0) 基因 表达 方法 

对 于 本 文 的 问题 ， 最 方便 的 方法 是 取 规划 (SIP) 的 变量 ， 订 单 完 
成 时 间 %, 作 为 基因 。 令 N 为 种 群 规模 ， 对 个 体 j， 其 基因 表达 即 为 实 
向 量 


(3.46) 


XG) =[a Gm Gens D1 N (3.47) 

(2) 适应 值 函数 

由 于 (SIP) 中 有 无 限 个 约束 ， 为 此 这 里 采用 文献 [5] 提出 的 非 
精确 算法 。 其 基本 思想 是 每 步 迭 代 中 只 处 理 有 限 个 最 不 满足 约束 ， 直 到 
所 有 约束 都 满足 为 止 。 

HFR, [t, x,(j)] 是 单 峰 函 数 ， 约 束 (3.42) 的 右边 最 多 只 有 
个 局 部 最 大 点 ， 且 这 些 点 位 于 区 间 [x 7L, x] (i=1, 2, =, n) 之 
内 。 

对 于 订单 (i21, 2, =, n), 定义 


i = arg max{ Y R, Le, G) ] 260 Fj) -L et x] 
(3. 48) 


eso X RUG) -60) (3.49) 
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BO (全 ，x(J)) >0， 则 该 约束 不 能 满足 。 引 入 资源 约束 的 容 差 
5. >0， 则 集合 
VTG) = (| i 21,2, n, BIR, XG) ] 2e ]j 91,2, N 
(3.50) 
即 为 个 体 j 的 最 不 满足 的 约束 集 。 个 体 j 的 扩展 目标 函数 为 


PO) = Ya(x-4) «M Y PLEX = 1,2, 


izt tfe VTG) 
(3.51) 
UB, ME—-TREPAMAAF. tE, eir puBUS, YU) 已 不 
再 是 时 间 上 的 函数 。 定 义 


F,, = max| V(j) | j=1,2,.,N} (3.52) 
那么 个 体 的 适应 值 函 数 FC) 可 用 式 (3.53) 计算 
F(j) =yF。 - V) jz1,2,,N (3.53) 


这 里 ，y >1， 是 一 个 不 同 适应 值 函数 的 个 体 选择 概率 的 控制 系数 。 实 
验 中 y =1.05， 这 样 最 差 的 个 体 仍 可 以 以 一 个 很 小 的 概率 产生 下 一 代 。 

(3) 选择 策略 

使 用 旋 轮 法 的 正比 选择 。 

(4) 遗传 算 子 

由 于 (SIP) 的 可 行 域 是 非 连通 的 ， 交 叉 可 能 由 可 行 解 产生 不 可 行 
解 ， 于 是 变异 成 了 唯一 的 选择 。 负 梯度 方向 是 目标 函数 的 最 速 下 降 方 
向 ， 沿 负 梯度 方向 的 变异 可 以 更 快 地 达到 可 行 域 ， 并 取得 最 优 解 。 沿 负 
梯度 方向 变异 的 遗传 算 子 描述 如 下 。 

对 于 个 体 j， 其 扩展 的 目标 函数 (3. 51) 的 梯度 向 量 为 

VPO = VHD VG) VG) j=1,2,7,N 

(3.54) 

其 第 i 个 分 量 为 

Vw) =2a,(x,-d,)+M Y 


ste TG) 


2a;(t; - x,(j) + 6) R,(t;,2,(j)) 
€; 


(3.55) 
若 按 选择 策略 ， 第 k+1 代 的 某 个 体 〈 即 第 上 代 的 孩子 ) 选择 个 体 j 
为 其 父亲 ， 则 
Xs) 2XG) -p V V() ,sz1,2,,N (3.56) 
XE, p 是 按 Erlang 分 布 产生 的 一 个 随机 步 长 ， 上 标 上 是 代数 指标 。 
由 于 MKF a;,， 当 VT(j) 非 空 时 ，-Vw(j) 主要 是 寻找 可 行 域 
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方向 ,一旦 达到 可 行 域 ,VT(j) 则 变 为 空 集 ， 该 方向 变 为 寻找 局 部 最 优 
点 的 方向 。 

分 析 表 明 ， 在 算法 的 初始 阶段 ， 随 机 产生 的 个 体 大 都 是 不 可 行 的 ， 
其 适应 值 函数 的 大 小 大 致 相当 ， 因 此 各 个 个 体 都 有 机 会 产生 下 一 代 ， 从 
而 达到 就 近 的 可 行 域 。 随 着 算法 的 进行 ， 某 些 个 体 的 目标 函数 明显 优 于 
其 他 个 体 ， 它 们 得 到 更 多 的 机 会 产生 下 一 代 ， 产 生 的 下 一 代 随 机 地 分 布 
在 它们 的 负 梯 度 方向 上 。 选 择 策略 近似 为 一 个 线性 搜索 程序 。 因 此 ， 负 
梯度 方向 变异 的 遗传 算 子 ， 使 该 算法 在 初始 阶段 是 一 个 随机 抽样 算法 ， 
随 着 迭代 的 进行 ， 算 法 逐步 变 为 一 个 多 点 的 最 速 下 降 法 。 算 法 的 这 种 性 
质 是 原 问题 所 需要 的 。 

(5) 停止 准则 

遗传 算法 通常 以 达到 最 大 的 繁殖 次 数 作为 停止 准则 。 对 于 本 小 节 所 
讨论 的 问题 ， 除 了 必须 达到 最 大 的 代数 外 ， 还 要 检查 是 否 达到 了 可 行 
解 ， 即 检查 是 否 满足 

vr*(j =Ø (3.57) 

其 中 ，NG 是 最 大 代数 ; j ER NG 代 中 最 优 个 体 的 个 数 ; 名 表示 空 集 。 

由 于 在 算法 的 初始 阶段 找 可 行 域 时 ， 步 长 应 大 一 些 ; 而 在 算法 终止 
前 为 保证 计算 的 精度 ， 步 长 应 很 小 。 因 此 ， 产 生 随 机 步 长 的 Erlang 分 
布 参数 ， 应 随 着 步 长 的 增加 而 减 小 。 

(6) 算法 步 又 

算法 的 具体 计算 步骤 如 下 。 

第 1 步 : 指定 Erlang 分 布 的 参数 m，k 和 缩减 率 r。 输 入 种 群 规模 
A 和 最 大 代数 NG。 输 入 约束 容 差 e, 和 计算 要 求 精度 Eo 

第 2 步 : 按 下 式 确定 计划 水 平 


max{n( Y. + Ya) max d.t i =1,2,-+,n)} 
T= 各 fi 


(3.58) 
&o 


n 是 一 个 资源 的 松弛 因子 ,可取 n=1.30。 

第 3 步 : 产生 初始 的 种 群 。 对 于 k=1, 2,…，N， 有 

x G) =L *&£(T-L) ,i=1,2,,n (3.59) 

b. £eU(O, 1), EREHE k=0, CRRA =1. 

第 4 步 : 令 上 =k+1。 如 >NG， 则 输出 停止 ; BW, RAR 
HELME 

585235. 用 公式 (3.51) ~ (3.53). 计算 所 有 个 体 的 扩展 目标 函数 
和 适应 值 函 数 ， 并 选择 
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j'zarg max| F(j) | j=1,2,.…,N} (3. 60) 
如 果 PG) < Wi"), We; =)’. 

第 6 步 : 计算 选择 概率 ， 并 按 选 择 策略 为 下 一 代 个 体 选择 父亲 ; 按 
式 (3.54) ~ (3.56) 计算 产生 下 一 代 个 体 。 

第 7 步 : 更 新 所 有 个 体 ， 即 

s (G)-2 0)， 了 =1.2,…,N (3.61) 
转 第 4 步 。 

3. 数值 结果 及 分 析 

以 上 算法 用 Fortran 语言 编程 ， 在 计算 机 上 计算 了 大 量 例题 ， 取 得 
了 满意 的 计算 结果 。 这 里 介绍 一 个 源 于 实际 背景 的 问题 。 

某 建筑 公司 接 到 10 份 建筑 工程 订单 。 该 公司 的 主要 资源 约束 是 人 
力 ， 当 前 的 可 用 人 力 为 100 kh/w( 千 时 / 周 )， 该 公司 的 人 力 将 按 0.5% 
的 速率 增长 。 有 两 项 维修 工程 已 经 排 定 ， 其 人 力 需 求 分 别 为 从 第 20 周 
Æ 40 周 需 200 kh, 28 30 周至 70 周 需 300 kh。 各 订单 的 建筑 周期 、 总 
人 力 需 求 、 合 同 总 额 及 希望 的 交 货 期 见 表 3. 5 所 示 。 公 司 希 望 根据 自己 
的 建筑 能 力 ， 初 排 一 个 尽 可 能 接近 客户 需求 的 交 货 期 的 建筑 计划 ， 以 便 
与 客户 商定 。 

is ”订单 数据 及 初 排 的 计划 完成 时 间 


订单 号 ”建筑 周期 BAD 合同 总 额 需求 交 货 期 ”计划 完成 时 间 


No. L/w ”需求 P/kh a/l0'$ d/w x/w 
1 20 400 10 25 30. 74 
2 20 900 18 30 20.76 
3 30 800 12 35 41.88 
4 40 800 15 40 40. 79 
5 25 1 000 28 40 52.50 
6 20 1200 20 40 86.77 
7 50 2 000 30 50 84.38 
8 10 300 18 15 10.00 
9 20 400 9 50 75.75 
10 60 1 500 30 60 87.28 


由 于 不 少 客户 的 交 货 期 集中 在 第 40 周 和 50 周 ， 在 第 20 周至 30 周 
形成 一 个 不 可 能 满足 的 资源 需求 高 蜂 。 按 前 面 介绍 的 算法 计算 ， 经 737 
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代 遗 传 找到 一 个 所 能 得 到 的 最 好 解 ， 见 表 3.5 最 后 一 列 所 示 。 该 结果 在 
满足 资源 约束 的 前 提 下 充分 利用 了 资源 。 

由 于 问题 的 可 行 域 是 非 凸 且 非 连通 的 ， 用 一 般 的 非 线 性 规划 方法 对 
扩展 的 目标 函数 (3. 51) 做 优化 ， 不 能 取得 最 优 解 ， 即 使 用 遗传 算法 
也 可 能 终止 在 局 部 最 优 解 上 。 例 如 ， 对 于 一 个 规模 较 小 的 问题 ， 从 不 同 
的 随机 数 种 子 出 发 ,经 过 反复 计算 , 算法 终止 在 6 个 不 同 的 解 
(A, c, E) Es 

计算 中 ， 逐 步 增 大 种 群 规模 ， 发 现 当 种 群 规模 较 小 时 ， 算 法 终止 在 
局 部 最 优 解 的 可 能 性 较 大 。 随 着 种 群 规模 增 大 ， 算 法 终止 在 最 优 解 的 概 
率 逐 步 增 大 ， 见 表 3. 6。 因 此 ， 实 际 应 用 中 在 不 超过 计算 机 能 力 的 前 提 
下 ， 尽 可 能 选择 较 大 的 种 群 规模 ， 就 能 取得 较 好 的 结果 。 

3.6 不 同 种 群 大 小 的 结果 比较 


1 2 3 4 5 6 7 8 9 10 寻 优 概率 


235 E E F A C A E D € € 0.2 
50 A A A A C A E A € B 0.6 
7S E A A C A C A A AOA 0.7 
100 A A A A A A A A A A 1.0 
问题 与 思考 

1. 对 于 编码 长 度 为 7 的 0 -1 编码， 判断 以 下 编码 的 合法 性 。 

(1) tt 0 20 1 1 0) 

(2) [1 0 1 1 0 0) 

(3) [0 1 1 0 0 1 0j 

(4) [0 0 0 0 0 0 0j 

(5) [2 13 4 5 7 6] 

2. 对 于 编码 长 度 为 7 的 顺序 编码 ， 判 断 以 下 编码 的 合法 性 。 

0)[7120 4 3 5] 

(2) [1 3 6 2 4 7] 

(3) [2 13 54 7 6] 

(0[81432 5 7] 

(5) [2 13 2 5 7 6] 

3. 对 于 编码 长 度 为 7 的 实数 编码 ， 判 断 以 下 编码 的 合法 性 。 
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(1) [3.5 19 2 7 L8 17 0] 
(2) [89.05 4.78 2 1 43 6.9] 
(3) [O 1 1 0 0 1 0] 
(4) [0 0 0 0 0 0 0) 
(5) [2 13 4 5 7 6] 


4. 对 于 背包 问题 : 7 件 财宝 的 价值 p;s， 质量 w,，i=1，2，…，7， 参 见 表 题 
3.4。 


表 题 3. 4 
i 1 2 3 4 5 6 7 
Pi 30 60 25 8 10 40 60 
w, 40 40 30 5 15 35 30 


如 背包 的 容量 为 120， 按 适合 优先 启发 式 (First Fit Heuristic) 将 以 下 编码 合法 
化 ， 并 计算 以 下 种 群 中 (Pop - Size =5) 各 个 个 体 的 适 值 和 选择 概率 。 

(0)[6 4 3 5 7 1 2] 2)[72435 61) 

(3) (1 3.4265 7] (4) [2 7 3 1 5 4 6] 

((53247 6 1] 

5. 双亲 染色 体 分 别 为 

P:[6128954710 3] 

P: [1074136285 9] 

两 个 切 点 位 置 分 别 为 : 4 和 8。 试 分 别 使 用 PMX. OX 和 CX 产生 两 个 子 代 染 
色 体 。 

6. 写 出 如 下 生成 树 的 Prüfer 数 编码 。 


图 3.32 题 图 6 
7. 一 个 7 节点 的 生成 树 的 Prafer 数 编码 为 [6 3 2 4 4], 试 画 出 该 生 
成 树 。 
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第 4 章 禁忌 搜索 算法 


禁忌 搜索 (Tabu Search 或 Taboo Search， 简 称 TS) 算法 是 继 遗 传 
算法 之 后 出 现 的 又 一 种 元 启发 式 (Meta - Heuristic) 优化 算法 ， 最 早 于 
1977 年 由 Glover 提出 。 禁 忌 搜索 算法 模仿 人 类 的 记忆 功能 ,使 用 禁忌 
表 来 封锁 刚 搜索 过 的 区 域 来 避免 还 回 搜索 ， 同 时 赦免 禁忌 区 域 中 的 一 些 
优良 状态 ， 进 而 保证 搜索 的 多 样 性 ， 从 而 达到 全 局 优化 。 迄 今 为 止 ， 禁 
鼠 搜索 算法 已 经 成 功 应 用 于 组 合 优化 、 生 产 调度 、 机 器 学 习 、 神 经 网 
络 、 电 力 系统 以 及 通信 系统 等 领域 ， 近 年 来 又 出 现 了 一 些 对 禁忌 搜索 算 
法 的 改进 与 扩展 。 本 章 对 禁忌 搜索 算法 的 基本 思想 、 关 键 环节 、 计 算 流 
程 以 及 基本 改进 与 应 用 做 一 介绍 。 


4.1 导 言 


早 在 1977 年 ，Glover 就 提出 了 禁忌 搜索 算法 ， 并 用 来 求解 整数 规 
划 问 题 ， 随 后 又 用 禁忌 搜索 算法 求解 了 典型 的 优化 问题 一 一 旅行 商 问 题 
(TSP). 1989—1990 年 Glover 在 《Operation Research of America》 上 系 
统 地 介绍 了 禁忌 搜索 算法 以 及 一 些 成 功 的 应 用 ， 于 是 禁忌 搜索 算法 引起 
了 广泛 的 关注 。 本 节 简 要 介绍 禁忌 搜索 算法 的 产生 背景 和 基本 思想 ， 并 
用 一 个 简单 算 例 说 明 禁 鼠 搜索 算法 中 的 一 些 基本 概念 。 


4.1.1 局 部 邻 域 搜索 


局 部 邻 域 搜 索 算法 基于 贪 禁 思想 ， 持 续 地 在 当前 邻 域 中 搜索 ， 直 至 
邻 域 中 再 也 没有 更 好 的 解 ， 也 称 为 候 山 启发 式 算法 。 考 虑 如 下 优化 问 
题 : 

(P) minc(x):xeXCR" (4.1) 
其 中 ,目标 函数 ce(x) 可 以 是 线性 的 或 者 非 线性 的 ， 解 空间 XX 由 EK 
空间 上 的 有 限 个 离散 点 构成 。 实 际 问题 中 ， 解 空间 X 可 能 由 各 种 各 样 
特定 的 约束 条 件 构成 。 邻 域 搜索 的 过 程 就 是 从 一 个 解 移动 到 另外 一 个 
解 ， 这 里 的 移动 用 * 表示 ， 移 动 后 得 到 的 一 个 解 用 s(x) 表示 ， 从 当前 
解 出 发 的 所 有 移动 得 到 的 解 的 集合 用 SO) 表示 ， 也 就 是 邻 域 的 概念 。 
简单 的 邻 域 搜索 算法 可 以 描述 为 
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第 1 步 : 选择 一 个 初始 解 xeX。 
第 2 步 : 在 当前 解 的 邻 域 中 选择 一 个 能 得 到 最 好 解 的 移动 *， 即 
c(s(x)) «c(x) , s(x) e S(x) 

如 果 这 样 的 移动 * 不 存在 ， 则 x 就 是 局 部 最 好 解 ， 算 法 停止 ;否则 s(x) 
是 当前 邻 域 中 的 最 好 解 。 

第 3 步 : Sxas(x) 为 当前 解 ， 转 第 2 步 ， 继 续 搜索 。 

这 种 邻 域 搜索 方法 容易 理解 ， 容 易 实 现 ， 而 且 具 有 很 好 的 通用 性 ， 
但 是 搜索 结果 完全 依赖 于 初始 解 和 邻 域 的 结构 ， 而 且 只 能 搜索 到 局 部 最 
优 解 。 为 了 实现 全 局 搜索 ,禁忌 搜索 采用 允许 接受 劣 解 来 逃离 局 部 最 
优 解 。 


4.1.2. 禁忌 搜索 算法 的 基本 思想 


禁忌 搜 索 算法 的 基本 思想 就 是 在 搜索 过 程 中 将 近期 的 历史 上 的 搜索 
过 程 存放 在 禁忌 表 (Tabu List) 中 ,阻止 算法 重复 进入 ， 这 样 就 有 效 地 
防止 了 搜索 过 程 的 循环 。 禁 忌 表 模 仿 了 人 类 的 记忆 功能 ， 禁 鼠 搜索 因此 
得 名 ， 所 以 称 它 是 一 种 智能 优化 算法 。 

具体 的 思路 如 下 : 禁忌 搜索 算法 采用 了 邻 域 选 优 的 搜索 方法 ， 为 了 
能 逃离 局 部 最 优 解 ， 算 法 必须 能 够 接受 劣 解 ， 也 就 是 每 一 次 迭代 得 到 的 
解 不 必 一 定 优 于 原来 的 解 。 但 是 ， 一 旦 接受 了 劣 解 ， 和 迭代 就 可 能 陷 人 循 
环 。 为 了 避免 循环 ， 算 法 将 最 近 接受 的 一 些 移动 放 在 禁忌 表 中 ， 在 以 后 
的 迭代 中 加 以 禁止 。 即 只 有 不 在 禁忌 表 中 的 较 好 解 〈 可 能 比 当 前 解 差 ) 
才 被 接受 作为 下 一 次 迭代 的 初始 解 。 随 着 迭代 的 进行 ,禁忌 表 不 断 更 
新 ， 经 过 一 定 迭 代 次 数 后 ， 最 早 进入 禁忌 表 的 移动 就 从 禁忌 表 中 解禁 退 
出 。 

下 面 给 出 一 个 简单 的 算 例 来 说 明 禁 忌 表 的 作用 。 由 七 种 不 同 的 绝缘 
材料 构成 一 种 绝缘 体 ， 如 何 排列 这 七 种 材料 才能 使 得 绝缘 的 效果 最 好 ? 
绝缘 效果 的 好 坏 以 绝缘 数值 表示 ， 绝 缘 数 值 越 大 ， 绝 缘 效 果 越 好 。 

当 算法 迭代 到 某 一 步 的 时 候 ， 各 种 材料 的 排列 顺序 为 2 一 4 一 7 一 
3 一 5 一 6 一 1 ， 交 换 各 种 材料 对 绝缘 效果 的 改善 情况 见 表 4. 1， 其 中 正 值 
表示 绝缘 效果 变 好 ， 负 值 表示 绝缘 效果 变 坏 。 可 见 ， 交 换 材料 1 和 3 可 
以 增加 绝缘 数值 2 ， 对 绝缘 材料 的 改善 效果 最 好 。 交 换 之 后 七 种 材料 的 
排列 顺序 为 2 一 4 一 7 一 1 一 5 一 6 一 3 ， 绝 缘 数值 为 18 ， 同 时 将 这 个 交换 
(1, 3) 加 入 到 禁忌 表 中 。 

此 时 ， 两 两 交换 各 种 材料 对 绝缘 效果 的 影响 情况 见 表 4. 2， 可 见 交 
换 任 意 两 种 材料 的 排列 顺序 都 不 能 改善 绝缘 情况 。 而 各 种 交换 方法 中 以 
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交换 材料 1 和 3 之 后 绝缘 数值 的 降低 最 小 ， 如 果 没 有 禁忌 表 ， 则 应 该 选 
择 这 个 交换 。 但 是 ， 交 换 材 料 1 和 3 之 后 各 种 材料 的 排列 顺序 又 变 为 
2 一 4 一 7 一 3 一 5 一 6 一 1 ， 回 到 了 上 一 次 交换 之 前 的 状态 ， 搜 索 陷 入 循环 ， 
无 法 继续 进行 。 可 是 禁忌 搜索 算法 中 由 于 使 用 了 禁忌 表 ， 交换 (1, 3) 
因为 处 于 禁忌 表 中 而 不 能 选择 ， 只 能 选择 其 他 的 交换 。 其 他 交换 中 ， 交 
换 材 料 2 和 4 之 后 绝缘 数值 降低 最 小 ， 因 此 被 选中 。 交 换 之 后 ， 各 种 材 
料 的 排列 顺序 为 4 一 2 一 7 一 1 一 5 一 6 一 3。 

虽然 交换 (2, 4) H5 (1, 3). 使 绝缘 数值 的 降低 更 多 ,但 是 能 将 
搜索 带 人 一 个 全 新 的 状态 ， 继 续 搜索 下 去 完全 可 能 搜索 到 更 好 的 排列 方 
法 。 由 于 使 用 了 禁忌 表 ， 避 兔 了 循环 搜索 ， 因 此 禁忌 搜索 算法 不 会 陷 人 
局 部 最 优 解 。 


RAL 第 一 次 交换 对 绝缘 效果 的 影响 
交换 的 材料 绝缘 效果 的 改善 情况 


表 4.2 第 二 次 交换 对 绝缘 效果 的 影响 
交换 的 材料 绝缘 效果 的 改善 情况 


由 于 禁忌 表 中 存放 的 是 移动 s 而 不 是 解 *>， 某 些 曾 经 接受 的 移动 完全 
可 能 把 解 引 向 新 的 区 域 ， 甚 至 可 能 得 到 优 于 历史 最 优 解 的 解 。 因 此 ， 如 
果 完全 按照 上 面 的 禁忌 策略 来 搜索 可 能 遗漏 一 些 区 域 ， 所 以 提出 了 一 个 
渴望 水 平 函数 4(*，x*) 的 概念 。 如 果 和 移动; 达到 了 渴望 水 平 ， 即 
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c(s(x)) «As, x) ， 那 么 这 个 移动 将 不 受 禁 鼠 表 的 限制 而 被 接受 ， 这 称 为 
“ 破 禁 ”。 这 样 就 可 能 跳 离 局 部 最 优 解 ， 实 现 全 局 搜索 。 当 然 ， 有 了 禁忌 
策略 和 渴望 水 平 ， 和 迭代 还 有 可 能 陷 和 循环。 因此， 必要 时 还 需要 给 出 其 
他 改进 手段 ， 例 如 对 从 一 个 解 到 另 一 个 解 的 移动 被 禁忌 的 次 数 进行 记录 
对 被 禁忌 次 数 较 多 的 移动 实行 一 定 的 惩罚 策略 ， 记 录 这 些 次 数 的 表 称 为 
中 期 表 ; 如 果 经 过 多 次 迭代 仍然 不 能 更 新 历史 最 优 解 ， 可 以 重新 给 出 初始 
解 ， 在 一 个 新 的 区 域 中 开始 搜索 ， 这 种 记录 多 个 初始 解 的 表 称 为 长 期 表 。 
当 迭 代 达 到 一 定 次 数 ， 或 者 满足 其 他 的 一 些 终止 条 件 时 ， 迁 代 终 止 。 

相对 于 普通 邻 域 搜索 而 言 ， 禁 鼠 搜索 算法 最 大 的 特点 是 可 以 接受 劣 
解 ， 这 是 避免 陷 人 局 部 最 优 的 首要 条 件 。 相 应 的 ， 禁 鼠 搜索 算法 不 能 以 
局 部 最 优 为 停止 准则 ， 而 是 设 定 最 大 迭代 次 数 或 者 给 出 其 他 特殊 的 停止 
准则 。 可 以 说 ， 禁 鼠 策 略 和 渴望 水 平 是 禁忌 搜索 算法 的 两 个 最 核心 思 
想 ， 而 两 者 又 是 对 立 统一 的 。 如 果 能 很 好 地 协调 禁忌 策略 与 淘 望 水 平 的 
关系 ， 便 能 很 好 地 实现 全 局 寻 优 。 


4.2. 算法 的 构成 要 素 


禁忌 搜索 算法 中 很 多 构成 要 素 对 搜索 的 速度 与 质量 至 关 重要 ， 下 面 
将 依次 给 出 介绍 ， 包 括 编码 方式 (Encode) 、 适 值 函数 、 解 的 初始 化 、 
移动 (Moving) 与 邻 域 (Neighborhood), MBH (Tabu List) 、 选 择 策 
略 (Selection Strategy), W 4 7k Æ ( Aspiration Level) 和 停止 准则 
(Stopping Rule) 等 。 


4.2.1 编码 方法 


和 第 3 章 所 讲 的 遗传 算法 一 样 ， 使 用 禁 鼠 搜索 算法 求解 一 个 问题 之 
前 ， 需 要 选择 一 种 编码 方法 。 编 码 就 是 将 实际 问题 的 解 用 一 种 便于 算法 
操作 的 形式 来 描述 ， 通 常 采用 数学 的 形式 ; 算法 进行 过 程 中 或 者 算法 结 
东 之 后 ， 还 需要 通过 解码 来 还 原 到 实际 问题 的 解 。 

根据 问题 的 具体 情况 ， 可 以 灵活 地 选择 编码 方式 。 例 如 ， 上 节 排 序 
问题 中 采取 了 顺序 编码 ， 各 元 素 的 相 邻 关 系 表达 了 各 种 绝缘 材料 的 排列 
顺序 。 对 于 背包 问题 ， 可 以 采用 0 - 工 编码 ， 编 码 的 某 一 位 为 0 表示 不 
选择 这 件 物品 ， 为 工 表示 选择 这 件 物品 。 对 于 实 优化 问题 ， 一 般 可 以 直 
接 使 用 实数 编码 ， 编 码 的 每 一 位 就 是 解 的 相应 维 的 取 值 。 

对 于 同一 个 问题 ， 也 可 能 有 多 种 编码 方式 可 供 选 择 。 例 如 分 组 问 
JE: 各 不 相同 的 n 件 物品 要 分 为 m 组 ,满足 特 定 的 约束 条 件 ， 要 达到 
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特定 的 目标 函数 。 以 下 两 种 编码 方式 都 是 可 行 的 。 

1. 编码 1 

以 自然 数 1~n 分 别 代表 n 件 物品 ，n 个 数 加 上 m -1 个 分 割 符号 
(例如 用 0 表示 ) 混 编 在 一 起 ， 随 意 排列 ， 便 得 到 一 种 编码 方式 。 例 
Al, n=9, m =3， 下 面 便 是 一 个 合法 的 编码 : 

1 一 3 一 4 一 0 一 2 一 6 一 7 一 5 一 0 一 8 一 9 

这 种 可 以 称 为 带 分 隔 符 的 顺序 编码 。 

2. 编码 2 

编码 的 每 一 位 分 别 代表 一 件 物品 ， 而 每 一 位 的 值 代表 该 物品 所 在 的 
分 组 。 同 样 是 n=9，m =3 的 情况 ， 可 以 给 出 如 下 形式 的 编码 : 

1 一 2 一 1 一 1 一 2 一 2 一 2 一 3 一 3 

这 种 是 一 般 的 自然 数 编码 。 

不 同 编码 形式 通常 是 可 以 相互 转化 的 ， 例 如 带 分 隔 符 的 顺序 编码 与 
一 般 的 自然 数 编码 就 很 容易 相互 转化 。 事 实 上 ， 上 面 给 出 的 两 个 编码 表 
示 的 是 同一 个 解 ， 也 就 是 物品 1、3、4 分 在 第 一 组 ; 物品 2、6、7、5 
分 在 第 二 组 ; 其 余 的 物品 8、9 分 在 第 三 组 。 

注意 到 : 如 果 稍 微 修改 编码 1 中 给 出 的 编码 举例 1 一 3 一 4 一 0 一 2 一 
6 一 7 一 5 一 0 一 8 一 9 ， 交 换 元 素 1 和 3 的 位 置 ， 得 到 如 下 一 个 新 的 编码 : 
3 一 1 一 4 一 0 一 2 一 6 一 7 一 5 一 0 一 8 一 9。 这 两 个 编码 是 不 同 的 ， 但 是 对 应 
的 解 是 相同 的 。 对 于 编码 2， 如 果 各 个 组 是 没有 区 别 的 ，3 一 2 一 3 一 3 一 
2 一 2 一 2 一 1 一 1 对 应 的 解 和 原来 编码 对 应 的 解 也 是 一 样 的 ， 只 不 过 是 将 
组 的 标号 做 了 调换 。 这 种 多 个 编码 对 应 同一 个 解 ， 即 编码 空间 的 大 小 大 
于 解 空间 的 大 小 的 情况 是 不 希望 出 现 的 。 实 际 应 用 中 ， 和 希望 编码 空间 尽 
可 能 和 解 空间 一 样 大 小 ， 也 就 是 说 编码 和 解 具 有 严格 的 一 一 对 应 关系 。 
然而 ， 对 于 许多 的 实际 问题 ， 这 并 不 是 一 件 容易 的 事情 。 


4.2.2 适 值 函数 的 构造 


类 似 于 遗传 算法 ， 适 值 函数 也 是 用 来 对 搜索 状态 进行 评价 的 。 将 目 
标 函 数 直接 作为 适 值 函 数 是 最 直接 也 是 最 容易 理解 的 做 法 。 当 然 ， 对 目 
标 函 数 的 任何 变形 都 可 以 作为 适 值 函 数 ， 只 要 这 个 变形 是 严格 单调 的 。 
例如 ， 式 (4.1) 中 目标 函数 为 c(x) ， 设 适 值 函 数 用 c'(x) RA, MA 
kc(x) +b 天 天 0 
- (e(x))? c(x) >0 
$67 a? a>0,a#1 
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都 是 可 以 的 ， 只 要 在 选择 的 时 候 注意 一 下 这 个 变形 应 该 和 原来 目标 函数 
的 大 小 顺序 保持 一 致 。 这 和 遗传 算法 的 适 值 函 数 的 标定 是 同一 道理 。 
适 值 函 数 的 选择 主要 考虑 提高 算法 的 效率 、 便 于 搜索 的 进行 等 因 
素 ， 以 上 给 出 的 各 种 变形 都 是 针对 特定 的 目标 函数 形式 为 了 简化 算法 
而 设计 的 。 例 如 ， 某 些 问 题 中 目标 函数 为 多 个 偏差 的 方 均 根 ， 即 


c(x) = 


_ ， 其 中 Ci=1,， =, n) 为 个 偏差 那么 适 值 函数 


可 以 取 为 偏差 的 平方 和 ， 即 c'(x) = n(e(x))? = x eh， 因为 这 样 的 


适 值 函数 与 目标 函数 具有 同样 的 增 减 性 ， 最 小 化 ce'(*) 的 同时 也 最 小 
化 了 ce(x) ， 同 时 避免 了 不 必要 的 除法 与 开 方 运算 。 再 如 ， 某 些 工 业 过 
程 的 目标 函数 需要 一 次 仿真 才能 得 到 ， 如 果 选 择 其 中 一 些 反映 目标 函数 
的 特征 参数 作为 适 值 函数 ， 可 以 大 大 节省 计算 时 间 。 


4.2.3 初始 解 的 获得 


禁忌 搜索 算法 可 以 随机 给 出 初始 解 ， 也 可 以 事先 使 用 其 他 启发 式 等 
算法 给 出 一 个 较 好 的 初始 解 。 由 于 禁忌 搜索 算法 主要 是 基于 邻 域 搜索 
的 ， 初 始 解 的 好 坏 对 搜索 的 性 能 影响 很 大 。 尤 其 是 一 些 带 有 很 复杂 约束 
的 优化 问题 ， 如 果 随机 给 出 初始 解 很 可 能 是 不 可 行 的 ， 甚 至 通过 多 步 搜 
索 也 很 难 找到 一 个 可 行 解 ， 这 个 时 候 应 该 针对 特定 的 复杂 约束 ， 采 用 启 
发 式 方法 或 其 他 方法 找 出 一 个 可 行 解 作 为 初始 解 。 


4.2.4 移动 与 邻 域 移动 


移动 是 从 当前 解 产生 新 解 的 途径 ， 例 如 问题 (P) 中 用 移动 产生 
BRIE s(x) 。 从 当前 解 可 以 进行 的 所 有 移动 构成 邻 域 ， 也 可 以 理解 为 从 
当前 解 经 过 “一 步 ” 可 以 到 达 的 区 域 。 适 当 的 移动 规则 的 设计 ， 是 取 
得 高 效 的 搜索 算法 的 关键 。 

邻 域 移动 的 方法 很 多 ， 求 解 不 同 的 问题 需要 设计 不 同 的 移动 规则 。 
例如 ， 前 面 排序 问题 中 采用 两 两 交换 式 的 移动 规则 ， 而 背包 问题 中 可 能 
采用 修改 解 中 任意 一 个 元 素 的 值 的 移动 规则 。 而 在 另外 一 些 问题 中 ， 移 
动 可 能 被 定义 为 一 系列 复杂 的 操作 。 禁 忌 搜索 算法 中 的 邻 域 移动 规则 和 
遗传 算法 中 的 交叉 算 子 和 变异 算 子 相似 ， 需 要 根据 特定 的 问题 来 设计 ， 
在 此 不 一 一 列举 。 
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4.2.5 BBR 


在 禁忌 搜索 算法 中 ,禁忌 表 是 用 来 防止 搜索 过 程 中 出 现 循环 ， 避 免 
陷入 局 部 最 优 的 。 它 通常 记录 最 近 接 受 的 若干 次 移动 ， 在 一 定 次 数 之 内 
禁止 再 次 被 访问 ; 过 了 一 定 次 数 之 后 ， 这 些 移动 从 禁忌 表 中 退出 ， 又 可 
以 重新 被 访问 。 禁 忌 表 是 禁忌 搜索 算法 中 的 核心 ， 它 的 功能 和 人 类 的 短 
期 记忆 功能 十 分 相似 ， 因 此 又 称 为 “短期 表 ”。 

1. 禁忌 对 象 

所 谓 禁 忌 对 象 就 是 放 和 人 禁忌 表 中 的 那些 元 素 ， 而 禁忌 的 目的 就 是 避 
免 迁 回 搜索 ， 尽 量 搜索 一 些 有 效 的 途径 。 禁 鼠 对 象 的 选择 十 分 灵活 ， 可 
以 是 最 近 访问 过 的 点 、 状 态 、 状 态 的 变化 以 及 目标 值 等 。 例 如 上 述 7 元 
素 排序 问题 中 ， 把 两 两 交换 的 对 象 作为 禁忌 对 象 ， 也 就 是 禁忌 了 状态 的 
变化 。 有 些 问 题 中 可 以 将 状态 本 身 作为 禁忌 对 象 ， 例 如 : 背包 问题 中 选 
择 “ 取 ”或 者 “不 取 ” 某 物品 为 禁忌 对 象 ;分 组 问题 中 把 某 元 素 和 它 
被 分 到 的 组 联系 在 一 起 ， 构 成 一 个 有 序数 对 作为 禁忌 对 象 还 有 些 问题 
中 可 以 把 目标 值 直 接 放 入 禁忌 表 中 作为 禁忌 对 象 。 

尽管 可 以 有 多 种 方式 给 出 禁忌 对 象 ， 但 是 归纳 起 来 ， 主 要 有 如 下 
三 种 : 

(1) 以 状态 的 本 身 或 者 状态 的 变化 作为 禁忌 对 象 。 例 如 把 移动 s 或 
者 从 当前 解 到 新 解 的 改变 x 一 s(x) 放 人 禁忌 表 中 ， 禁 止 以 后 再 做 这 样 
的 移动 ， 避 免 搜索 循环 。 选 择 这 种 禁忌 对 象 比较 容易 理解 ， 但 是 禁忌 的 
范围 比较 小 ， 只 有 和 这 些 完全 相同 的 状态 才 被 禁忌 ， 搜 索 空间 很 大 。 而 
存储 禁忌 对 象 所 占 的 空间 和 所 用 的 时 间 却 比较 多 。 

(2) 以 状态 分 量 或 者 状态 分 量 的 变化 作为 禁忌 对 象 。 对 于 一 些 维 
数 很 大 的 问题 ， 每 一 次 移动 可 能 都 有 很 多 状态 分 量 发 生变 化 。 如 果 只 取 
其 中 一 个 分 量 或 者 少数 几 个 分 量 作为 禁忌 对 象 ， 那 么 禁忌 的 范围 比较 
大 ， 而 且 存储 的 空间 和 时 间 都 比较 少 。 例 如 移动 *= (s. 82, rs oss 
其 中 4d 为 这 种 移动 包含 的 分 量 个 数 ， 可 以 取 s,(1<i<d) 作为 禁忌 
对 象 。 

(3) 采取 类 似 于 等 高 线 的 做 法 ， 将 目标 值 作为 禁忌 对 象 。 这 种 做 
法 将 具有 相同 目标 值 的 状态 视 为 同一 个 状态 ， 大 大 增加 了 禁忌 的 范围 。 
对 于 上 述 例子 ， 可 以 采用 ce(s(x) ) 作 为 禁忌 对 象 。 

这 三 种 做 法 中 ， 第 一 种 做 法 的 禁 鼠 范 围 适中 ， 第 二 种 做 法 的 禁忌 范 
围 较 小 ， 第 三 种 做 法 的 禁忌 范围 较 大 。 如 果 禁 鼠 范 围 比 较 大 ， 则 可 能 陷 
入 局 部 最 优 解 ; 反之 ， 则 容易 陷入 循环 。 实 际 问题 中 ， 要 根据 问题 的 规 
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模 、 禁 鼠 表 的 长 度 等 具体 情况 来 确定 禁忌 对 象 。 

2. 禁忌 长 度 

所 谓 禁 鼠 长 度 (Tabu Size) ， 就 是 禁忌 表 的 大 小 。 一 个 禁忌 对 象 进 
入 禁忌 表 后 ， 只 有 经 过 一 个 确定 的 迭代 次 数 ， 才 能 从 禁忌 表 中 退出 。 也 
就 是 说 ， 在 当前 迭代 之 后 的 确定 次 迭代 中 ， 这 个 发 生 不 久 的 相同 操作 是 
被 禁止 的 。 容 易 知道 ， 禁 鼠 表 的 长 度 越 小 ， 计 算 时 间 和 存储 空间 越 少 ， 
这 是 任何 一 个 算法 都 希望 的 ; 但 是 ， 如 果 禁 忌 长 度 过 小 ， 会 造成 搜索 的 
循环 ， 这 又 是 要 避免 的 。 

禁忌 长 度 不 但 影响 了 搜索 的 时 间 ， 还 直接 关系 着 搜索 的 两 个 关键 策 
Wi. 局 域 搜索 策略 和 广 域 搜索 策略 。 如 果 禁 鼠 表 比较 长 ， 便 于 在 更 广阔 
的 区 域 搜索 ， 广 域 搜索 性 能 比较 好 ; 而 禁忌 表 比 较 短 ， 则 使 得 搜索 在 小 
的 范围 进行 ， 局 域 搜索 性 能 比较 好 。 禁 忌 长 度 的 设 定 要 依据 问题 的 规 
模 、 邻 域 的 大 小 来 确定 ， 从 而 达到 平衡 这 两 种 搜索 策略 的 目的 。 

总 结 起 来 ， 主 要 有 如 下 一 些 设 定 禁忌 长 度 的 方法 。 

@ 禁 忌 长 度 :固定 不 变 。: 可 以 取 一 些 与 问题 无 关 的 常数 ， 例 如 
t=5, 7, 1 等 值 。 也 有 一 些 有 学 者 认为 : 禁忌 长 度 应 该 与 问题 的 规模 
AX, Binder n, KH n 为 问题 的 规模 。 这 种 方法 方便 简单 ， 而 且 
容易 实现 。 

@ 禁 忌 长 度 : 随 迭代 的 进行 而 改变 。 根 据 迭 代 的 具体 情况 ， 按 照 某 
种 规则 ， 禁 鼠 长 度 在 区 间 [ ts。，tww] 内 变化 。 这 个 禁 忆 长 度 的 区 间 可 以 
与 问题 无 关 ， 例如 [1, 10]; 或 者 与 要 求解 问题 的 规模 有 关 ， 例如 
[0.9Vn，1.1Vn]。 而 这 个 区 间 的 两 个 端点 也 可 以 随 着 迭代 的 进行 而 
改变 。 

大 量 研究 表明 ， 动 态 的 设 定 禁忌 长 度 比 固定 不 变 的 禁忌 长 度 具有 更 
好 的 性 能 。 关 于 禁忌 长 度 的 更 深入 探讨 ， 见 本 章 关于 主动 禁忌 搜索 算法 
的 介绍 。 


4.2.6 选择 策略 


选择 策略 就 是 从 邻 域 中 选择 一 个 比较 好 的 解 作为 下 一 次 迭代 初始 解 
的 方法 ， 用 公式 可 以 表示 为 

x = opt s(*) = arg[ max/min c'(s(x))] (4.2) 

其 中 ,x 为 当前 解 ，x' 为 选 出 的 邻 域 最 好 解 ，s(*) e V 为 邻 域 解 ，c'(s(x)) 

为 候选 解 *(*) MEERA, VOS) 称 为 候选 解 集 ， 它 是 邻 域 的 一 个 

子 集 。 要 根据 问题 的 性 质 和 适 值 函 数 的 形式 ， 在 候选 解 集中 选择 一 个 最 
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好 的 解 。 然 而 ， 候 选 解 集 的 确定 ， 与 上 文 讨 论 的 禁忌 长 度 的 大 小 相似 ， 
对 搜索 速度 与 性 能 影响 都 很 大 。 

O) 候选 解 集 为 整个 邻 域 ， 即 Y=S(x*)。 这 种 选择 策略 就 是 从 整 
个 邻 域 中 选择 一 个 最 优 的 解 作为 下 一 次 迭代 的 初始 解 。 这 种 策略 择优 效 
果 好 ， 相 当 于 选择 了 最 速 下 降 方向 ， 但 是 要 扫描 整个 邻 域 ， 计 算 时 间 比 
较 长 ， 尤 其 对 于 大 规模 的 问题 ， 这 种 策略 可 能 让 人 无法 接受 。 在 上 文 的 
7 元 素 示例 中 ， 采 用 的 就 是 这 种 方法 ， 只 是 限于 篇 幅 ， 只 列 出 了 比较 好 
的 前 几 个 移动 ， 小 规模 问题 中 这 种 策略 是 可 以 的 。 

(2) 候选 解 集 为 邻 域 的 真子 集 ， 即 VC S(x)。 这 种 策略 只 扫描 邻 
域 的 一 部 分 来 构成 候选 解 集 ， 甚 至 是 一 小 部 分 ，|V| 生 |S(x)|， 这 里 
1Y| 和 15(x) | 分 别 表示 候选 解 集 和 邻 域 的 大 小 。 这 种 策略 虽然 不 一 定 取 
到 了 邻 域 中 的 最 好 解 ， 但 是 节省 了 大 量 的 时 间 ， 可 以 进行 更 多 次 迭代 ， 
也 可 以 找到 很 好 的 解 。 极 限 情况 下 ， 可 以 选择 第 一 个 找到 的 改进 解 ， 也 
就 是 说 :只 要 发 现 了 改进 解 ， 马 上 停止 扫描 。 当 然 ， 如 果 整 个 邻 域 中 没 
有 改进 解 ， 那 么 只 好 选择 一 个 最 好 的 劣 解 了 。 

注 : 本 节 讨论 选择 策略 的 过 程 中 没有 考虑 禁忌 表 。 实 际 上 ， 其 中 的 
邻 域 应 该 是 邻 域 中 除了 禁 鼠 解 之 外 的 区 域 ， 可 以 表示 为 5(*) -To 

禁忌 搜索 算法 在 每 一 步 迁 代 的 过 程 中 ， 都 包含 了 启发 式 思 想 ， 是 启发 
式 的 启发 式 ， 正 是 从 这 个 角度 才 被 称 为 元 启发 式 算法 ( Meta-Heuristics)。 


4.2.7 渴望 水 平 


在 某 些 特定 的 条 件 下 ， 不 管 某 个 移动 是 否 在 禁忌 表 中 ， 都 接受 这 个 
移动 ， 并 更 新 当前 解 和 历史 最 优 解 。 这 个 移动 满足 的 这 个 特定 条 件 ， 称 
为 渴望 水 平 (Aspiration Level) ， 或 称 为 破 禁 水 平 、 特 赦 准 则 、 碾 视 准 
则 等 ， 例 如 下 述 7 元 素 排序 问题 示例 中 ， 当 和 迭代 到 第 4 步 的 时 候 ， 移 动 
(4, 5) 虽然 在 禁忌 表 中 ， 仍 旧 选 择 了 它 ， 这 是 因为 这 个 移动 能 得 到 一 个 
超过 历史 最 优 解 的 解 ， 能 使 历史 最 优 值 从 18 变 为 20， 满 足 了 淘 望 水 平 。 

渴望 水 平 的 设 定 也 有 多 种 形式 ， 总 结 起 来 如 下 。 

(1) 基于 适 配 值 的 准则 。 如 果 某 个 候选 解 的 适 配 值 优 于 历史 最 优 
值 ， 也 称 为 “Best so Far” 状 态 ， 那 么 无 论 这 个 候选 解 是 否 处 于 被 禁忌 
状态 ， 都 会 被 接受 。 对 于 开始 提 到 的 问题 (P) ， 这 种 渴望 水 平 可 以 描 
述 为 

e(s(x)) «c(x7) (4.3) 
这 个 准则 最 容易 理解 ， 应 用 得 也 最 广泛 ， 例 如 下 述 7 元 素 排序 问题 的 示 
例 中 应 用 的 就 是 这 个 准则 。 直 观 上 理解 ， 这 个 准则 就 是 找到 了 更 好 的 
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解 ， 那 么 即使 这 个 移动 被 禁忌 了 ， 也 要 给 它 破 禁 ， 同 时 要 更 新 历史 最 
优 解 。 

然而 ， 如 果 只 选用 这 一 种 渴望 水 平 ， 那 么 可 能 错过 一 些 有 潜力 的 区 
域 。 有 一 些 移动 虽然 不 能 立即 带 来 优 于 历史 最 优 解 的 解 ， 但 是 有 这 个 潜 
力 ， 可 能 在 接 下 来 的 几 步 迭 代 中 超过 历史 最 优 ， 于 是 出 现 了 其 他 渴望 
水 平 。 

(2) 基于 搜索 方向 的 准则 。 如 果 某 禁 忌 对 象 进入 禁忌 表 的 时 候 改 
善 了 适 配 值 ， 而 这 次 这 个 被 禁忌 的 候选 解 又 改善 了 适 配 值 ， 那 么 这 个 移 
动 破 禁 。 对 于 问题 (P) ， 这 个 准则 可 以 描述 为 

c(s(x)) «c(x) B. e(s(x)) «c(x) (4.4) 
其 中 x 表示 该 对 象 上 次 被 禁忌 时 的 解 。 这 种 准则 也 可 以 很 好 地 避免 搜索 
循环 ， 一 般 的 ， 如 果 这 次 经 过 某 个 状态 时 改善 了 适 配 值 ， 下 一 次 经 过 这 
个 状态 时 恶化 了 适 配 值 ， 那 么 很 可 能 是 按 原 路 返回 了 。 例 如 上 文 7 元 素 
排序 问题 中 ,第 二 步 迭 代 交 换 1 和 3 适 配 值 增加 2， 而 紧 接 着 ,如果 再 
交换 1 和 3， 适 配 值 就 减少 2， 明 显 是 回 到 了 原来 的 状态 ， 尽 管 这 是 当 
前 最 好 的 移动 ， 还 是 不 能 接受 ， 避 免 了 搜索 循环 。 直 观 上 看 ， 这 种 策略 
可 以 理解 为 算法 正在 按 有 效 的 方向 继续 搜索 。 

G) 基于 影响 力 的 准则 。 和 迭代 过 程 中 ， 不 同 对 象 对 适 配 值 的 影响 
不 同 ， 有 的 较 大 ， 有 的 较 小 。 影 响 较 大 的 可 能 是 问题 的 主要 因素 ， 影 响 
较 小 的 可 能 是 次 要 因素 。 可 以 结合 禁忌 对 象 在 禁忌 表 中 的 位 置 ， 即 进入 
禁忌 表 时 间 的 长 短 和 对 适 配 值 影响 力 的 大 小 ， 来 制定 渴望 水 平 。 对 于 这 
种 策略 的 直观 理解 为 : 解禁 一 个 影响 力 较 大 的 对 象 ， 可 能 对 适 配 值 有 较 
大 的 影响 。 这 里 影响 力 可 以 是 增加 适 配 值 ， 也 可 以 是 减少 适 配 值 。 当 
然 ， 这 种 做 法 需要 额外 地 制定 一 个 衡量 一 个 对 象 影响 力 大 小 的 方案 ， 增 
加 了 算法 的 复杂 性 。 

(4) 其 他 准则 。 例 如 ， 当 所 有 候选 解 都 被 禁忌 ， 而 且 不 满足 上 述 
渴望 水 平 ， 那 么 可 以 选择 其 中 一 个 最 好 解 来 解除 禁忌 ， 否 则 ， 算 法 将 无 
法 继续 下 去 。 事 实 上 ， 这 种 所 有 候选 解 都 被 禁忌 而 且 不 优 于 历史 最 优 解 
的 情况 是 应 该 尽量 避免 的 ， 比 如 可 以 设置 禁忌 长 度 小 于 邻 域 的 大 小 。 

渴望 水 平 的 设计 比较 灵活 ， 实 际 应 用 中 可 以 采取 上 述 准则 中 的 一 
种 ， 或 者 同时 选择 其 中 的 几 种 。 而 且 ， 渴望 水 平 还 要 与 禁忌 长 度 、 候 选 
解 集 等 策略 综合 考虑 ,平衡 集中 强化 搜索 与 分 散 多 样 化 搜索 。 

禁 鼠 策略 与 渴望 水 平 是 禁忌 搜索 算法 中 两 大 核心 策略 ， 两 者 是 对 立 
统一 的 ， 也 可 以 看 做 是 一 个 统一 原则 的 两 个 方面 。 可 以 通过 设置 不 同 的 
禁忌 长 度 来 禁止 一 些 对 象 ， 又 可 以 通过 设置 不 同 的 淘 望 水 平 来 解除 一 些 
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对 象 ， 从 而 实现 全 局 搜索 。 
4.2.8 停止 准则 


和 其 他 元 启发 式 算法 ， 包 括 遗 传 算法 、 模 拟 退化 算法 等 一 样 ， 禁 鼠 
搜索 算法 不 能 保证 找到 问题 的 全 局 最 优 解 ， 而 且 没有 判断 是 否 找到 全 局 
最 优 解 的 准则 。 因 此 ， 必 须 另 外 给 出 停止 准则 来 停止 搜索 ， 常 用 的 包括 
如 下 几 种 。 

@D 给 定 最 大 迭代 步 数 。 这 个 方法 简单 容易 操作 ， 在 实际 中 应 用 最 为 
广泛 。 

@@ 得 到 满意 解 。 如 果 事 先知 道 问题 的 最 优 解 ， 而 算法 已 经 达到 最 优 
解 ， 或 者 与 最 优 解 的 偏差 达到 满意 的 程度 ， 则 停止 算法 。 这 种 情况 常 应 
用 于 算法 效果 的 验证 ， 因 为 只 有 这 个 时 候 问题 的 最 优 解 才 可 能 是 事先 知 
道 的 。 或 者 在 实际 应 用 中 ， 用 其 他 估 界 算法 已 经 估算 出 问题 的 上 界 
(目标 函数 是 最 大 化 ) 或 者 下 界 〈 目 标 函数 是 最 小 化 ) ， 如 果 搜索 得 到 
的 历史 最 优 值 与 这 些 “ 界 ”的 偏差 满足 要 求 ， 停 止 算法 ， 其 实 这 也 是 
得 到 了 满意 解 。 

@ 设 定 某 对 象 的 最 大 禁忌 频率 。 如 果 某 对 象 的 禁忌 频率 达到 了 事先 给 
定 的 阐 值 ， 或 者 历史 最 优 值 连 续 若干 步 失 代 得 不 到 改善 ， 则 算法 停止 。 


4.3 算法 流程 与 算 例 


以 上 给 出 了 用 禁忌 搜索 算法 求解 排序 问题 的 一 个 简单 示例 ， 而 后 介 
绍 了 禁忌 搜索 算法 中 的 一 些 基本 概念 。 简 单 地 讲 ， 禁忌 搜索 算法 以 禁忌 
表 来 记录 最 近 搜索 过 的 一 些 状态 ， 对 于 当前 邻 域 中 一 个 比较 好 的 解 ， 如 
果 不 在 禁忌 表 中 ， 那 么 选择 它 作 为 下 一 步 迭 代 的 初始 解 ， 否 则 宁愿 选择 
一 个 比较 差 的 但 是 不 在 禁忌 表 中 的 解 ; 而 如 果 某 个 解 或 者 状态 足够 得 
好 ， 则 不 论 其 是 否 在 禁忌 表 中 ， 都 接受 这 个 解 ， 如 此 和 迭代， 直至 满足 事 
先 设 定 的 停止 准则 。 


4.3.1 基本 步骤 


由 于 禁忌 搜索 算法 的 渴望 水 平 、 选 择 策略 以 及 停止 准则 等 都 可 以 有 
多 种 设 定 方式 ， 如 果 再 使 用 中 期 表 和 长 期 表 ， 禁 鼠 搜 索 算法 的 步骤 将 多 
种 多 样 。 下 面 给 出 一 个 最 基本 的 步骤 (不 考虑 中 期 表 和 长 期 表 ) 。 

第 1 步 : 初始 化 。 给 出 初始 解 ， 禁 鼠 表 设 为 空 。 

第 2 步 : 判断 是 否 满足 停止 条 件 。 如 果 满 足 ， 输 出 结果 ， 算 法 停 
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止 ; 否则 继续 以 下 步骤 。 

第 3 步 : 对 于 候选 解 集 中 的 最 好 解 ， 判 断 其 是 否 满足 渴望 水 平 。 如 
果 满 足 ， 更 新 渴望 水 平 ， 更 新 当前 解 ， 转 第 5 步 ; 否则 继续 以 下 步骤 。 

第 4 步 : 选择 候选 解 集中 不 被 禁忌 (不 对 应 于 禁忌 表 中 的 一 个 对 
象 ) 的 最 好 解 作为 当前 解 。 

BSH: 更 新 禁忌 表 。 

第 6 步 : 转 第 2 步 。 

当然 ， 这 样 的 步骤 也 不 可 能 概括 禁 鼠 搜索 算法 的 各 种 情况 ， 只 是 给 
出 一 个 一 般 的 描述 供 读者 参考 。 


4.3.2 流程 图 


以 本 章 开始 给 出 的 问题 (P). 为 例 ， 如 果 以 整个 邻 域 为 候选 解 集 ， 
以 目标 函数 作为 适 值 函数 ， 以 给 定 最 大 代数 NG 为 停止 准则 ， 以 优 于 历 
史 最 优 解 为 渴望 水 平 ， 则 算法 的 流程 如 图 4. 1 所 示 。 


N 
4 x-erg min o(s), SESH) 


ER 


4 x-arg min c(s(x)), sx) ES) -T 


图 4.1 禁忌 搜索 算法 的 流程 图 1 
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从 图 4. 1 中 可 以 看 到 ， 这 种 方法 中 当 所 有 邻 域 解 都 被 禁忌 时 ， 算 
法 异常 终止 了 。 这 是 禁忌 长 度 过 大 、 而 邻 域 过 小 造成 的 ， 设 计算 法 时 
一 般 应 该 避免 这 种 情况 的 发 生 。 如 果 以 第 一 个 改进 解 为 候选 解 ， 当 所 
有 邻 域 解 都 被 禁忌 时 ， 选 择 其 中 最 好 的 解 来 破 禁 ， 当 然 发 现 优 于 历史 
最 优 解 时 则 不 考虑 禁忌 状态 ， 可 以 得 到 另外 一 种 流程 图 ， 如 图 4.2 
所 示 。 


isi n [r arg min s), ESE) 
<A 


图 4.2 禁忌 搜索 算法 的 流程 图 2 

可 见 ， 如 果 禁 忌 搜 索 算法 中 的 各 环节 采取 的 策略 不 同 ， 得 到 的 程序 
流程 图 也 是 不 同 的 ， 究 竟 采 取 哪 种 策略 ,应 该 根据 问题 的 具体 情况 
确定 。 

同 传统 的 优化 算法 相 比 ， 禁 鼠 搜 索 算 法 具有 如 下 优点 : 

@@ 能 接受 劣 解 ， 具 有 很 好 的 疏 山 能 力 。 

@ 区 域 集中 搜索 与 全 局 分 散 搜索 能 较 好 平衡 。 

但 是 ， 以 上 介绍 的 基本 禁忌 搜索 也 有 明显 的 不 足 : 

Q@ 对 初始 解 和 邻 域 结构 有 较 大 的 依赖 性 ， 一 个 好 的 初始 解 可 能 很 快 
迭代 到 最 优 解 ， 一 个 较 差 的 初始 解 可 能 会 极 大 地 降低 搜索 质量 。 

加 搜索 过 程 是 串 行 的 ， 不 像 遗 传 算法 那样 具有 并 行 的 搜索 机 制 。 
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为 了 全 面 提高 禁忌 搜索 算法 的 性 能 ， 可 以 针对 其 中 的 关键 策略 以 及 
参数 设置 等 方面 进行 改进 ， 也 可 以 与 其 他 优化 算法 相 结合 。 值 得 指出 的 
E, 这些 改 进 后 的 算法 (或 者 混合 算法 ) 仍然 可 以 叫做 “禁忌 搜索 算 
法 ”， 因 为 禁忌 搜索 算法 并 没有 规定 必须 是 上 述 基本 禁忌 搜索 算法 的 情 
D, 禁忌 搜索 算法 是 使 用 “禁忌 机 制 ” 和 “地 免 准则 ”引导 搜索 的 思 
想 。 与 其 说 禁忌 搜索 算法 是 一 种 方法 ， 不 如 说 是 一 种 技术 ， 或 者 说 是 一 
门 艺术 。 只 有 应 用 得 好 ， 才 能 很 好 地 解决 实际 问题 。 


4.3.3 一 个 简单 的 例子 


下 面 以 一 个 7 元 素 的 排序 问题 为 例 ， 来 说 明 禁 鼠 搜 索 算 法 的 算法 流 
程 。 问 题 的 背景 可 以 理解 为 : 由 七 种 不 同 的 绝缘 材料 构成 一 种 绝缘 体 
如 何 排列 才能 使 得 绝缘 的 效果 最 好 ? 

组 合 优化 问题 是 禁忌 搜索 算法 应 用 得 最 广泛 的 领域 ， 而 大 量 的 组 
合 优化 问题 中 ， 排 序 问题 是 典型 代表 ， 如 旅行 商 问题 (TSP) 、 作 业 
调度 问题 等 。 对 于 一 个 元素 的 排序 问题 ， 所 有 解 的 数目 即 解 空间 的 
大 小 为 n 的 全 排列 P; =n!。 当 n 较 大 时 ,这 将 是 一 个 天 文 数字 ， 穷 举 
搜索 是 不 可 能 完成 的 。 使 用 禁忌 搜索 算法 可 以 在 较 少 的 迭代 后 得 到 一 
个 满意 解 。 

首先 确定 编码 方式 ， 这 里 采用 顺序 编码 ， 即 1 ~7 共 7 个 数字 的 一 
个 排列 便 是 一 种 合法 的 编码 。 定 义 互 换 操作 为 这 个 问题 的 邻 域 结构 ， 任 
意 交换 两 种 材料 的 位 置 ， 便 得 到 一 个 邻 域 解 。 这 样 ， 对 于 每 一 个 解 ， 它 
的 邻 域 解 的 个 数 为 C; =21 个 ， 从 当前 解 到 邻 域 中 的 另外 一 个 解 的 改变 
称 为 一 次 邻 域 移动 。 然 后 ， 设 计 禁 鼠 表 的 结构 : 以 互 换 的 两 种 材料 
(以 1~7 的 编码 表示 ) 构成 的 数 对 作为 禁忌 表 的 元 素 。 禁 鼠 表 的 长 度 
取 为 3， 也 就 是 说 : 当 第 4 个 元 素 进入 禁忌 表 时 ， 第 1 个 元 素 从 禁 鼠 表 
中 退出 。 以 绝缘 效果 作为 目标 函数 值 ， 目 标 函 数值 越 大 越 好 。 最 后 给 出 
WAKE: 如 果 当 前 解 的 某 移动 得 到 的 解 优 于 历史 最 优 解 ， 则 不 论 该 移 
动 是 否 在 禁 鼠 表 中 ， 都 将 接受 作为 下 一 次 迭代 的 初始 解 。 设 定 最 大 迁 代 
(移动 ) 次 数 为 停止 准则 ， 本 例 中 最 大 迭代 次 数 取 为 5。 

初始 状态 : 随机 给 出 一 个 初始 解 为 : 2 一 5 一 7 一 3 一 4 一 6 一 1， 目 标 
函数 值 为 10 ， 历 史 最 优 值 也 为 10， 禁 鼠 表 为 空 。 由 给 定 解 计算 出 目标 
函数 值 的 具体 过 程 与 本 算法 关系 不 大 ， 在 此 不 详细 介绍 ， 而 是 直接 给 出 
目标 函数 值 的 改变 情况 。 交 换 解 的 任意 两 个 元 素 ， 得 到 新 解 的 目标 函数 
值 与 当前 目标 值 之 差 。 限 于 篇 幅 ， 这 里 只 列 出 最 好 的 5 个 移动 。 这 个 状 
态 如 图 4.3 所 示 。 
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移动 (x) | 适 配 值 改变 Ac(x) 。 当前 解 x: 2 一 5 一 7 一 3 一 4 一 6 一 1; 
~i; | e 历史 最 优 值 c(*")=10; HWM el) =10。 
43, T 4 
3,6 2 ER 
2,3 0 Ø 
1,4 -1 2 2 
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图 4.3 7 元 素 排序 问题 初始 状态 


第 1 步 : 当前 邻 域 中 目标 函数 值 改善 最 大 的 移动 是 (4，5) ， 即 元 
X AS 交换 ， 可 以 增加 目标 值 6， 而 这 个 移动 不 在 禁 鼠 表 中 ， 所 以 本 
次 迭代 中 选择 了 这 个 移动 。 当 前 解 变 为 2 一 4 一 7 一 3 一 5 一 6 一 1; 目标 函 
数值 c(z) =10 +6 =16; 历史 最 优 值 (x*) =16; 将 移动 (4, 5) 加 入 
禁忌 表 中 。 针 对 当前 解 ， 交 换 解 的 任意 两 个 元 素 ， 得 到 目标 函数 值 改善 
最 大 的 5 个 移动 如 图 4. 4 所 示 。 
Bah s(x) | 适 配 值 改变 Ac(x) 。 当前 解 4: 2 一 4 一 7 一 3 一 5 一 6 一 1; 


n 历史 最 优 值 e(x* ) =16; 当前 值 c(x) =16。 
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图 4.4 7 元 素 排 序 问题 第 一 次 迭代 后 状态 


第 2 步 : 当前 邻 域 中 目标 函数 值 改 善 最 大 的 移动 是 (1, 3), WA 
不 在 禁忌 表 中 ， 故 本 次 迭代 选择 这 个 移动 。 当 前 解 变 为 2 一 4 一 7 一 1 一 
5 一 6 一 3; 目标 函数 值 e(x) = 18; HERR (x°) 718; 将 移动 (1， 
3) 加 入 禁忌 表 中 ， 同 时 禁忌 表 中 的 原 有 元 素 下 移 一 个 位 置 。 针 对 当前 
解 ， 交 换 解 的 任意 两 个 元 素 ， 得 到 目标 函数 值 的 改善 情况 ， 这 个 状态 如 
图 4.5 所 示 。 
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移动 (x) | 适 配 值 改变 Ac(x) 。 当前 解 x: 2 一 4 一 7 一 1 一 5 一 6 一 3; 
| 历史 最 优 值 c(x* ) 218; 当前 值 c(x) =18。 
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图 4.5 7 元素 排序 问题 第 二 次 选 代 后 状态 


第 3 步 : 当前 邻 域 中 所 有 移动 都 不 能 改善 当前 解 ， 证 明 当前 解 就 是 
一 个 局 部 最 优 解 ， 如 果 按照 普通 的 邻 域 搜索 规则 ， 算 法 就 停止 了 。 可 是 
禁忌 搜索 算法 接受 劣 解 ， 所 以 算法 才能 继续 。 目 标 函 数值 改善 最 大 的 
(尽管 是 劣 解 ， 为 了 统一 ， 仍 然 使 用 这 个 说 法 ) 移动 为 (1，3) 。 但 是 ， 
这 个 移动 已 经 在 禁忌 表 中 ， 而 且 c(x) -2 <c(x")， 说明 这 个 移动 得 到 
的 解 不 能 改善 历史 最 优 解 ， 没 有 达到 渴望 水 平 。 所 以 选择 次 优 的 移动 
(2，4) ， 当 前 解 变 为 4 一 2 一 7 一 1 一 5 一 6 一 3; 当前 值 为 ce(x) = 14， 而 
历史 最 优 值 不 变 ， 修 改 禁忌 表 。 再 一 次 考察 所 有 移动 得 到 的 目标 函数 值 
改变 情况 ， 相 应 状态 如 图 4.6 所 示 。 
移动 (x) | 适 配 值 改变 Ac(x) HMM r: 4 一 2 一 7 一 1 一 5 一 6 一 3; 
———— — — — 历史 最 优 值 cz*) =18; 当前 值 c(x) =14。 
4,5 6 
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4.6 7 元 素 排序 问题 第 三 次 迭代 后 状态 


第 4 步 : 邻 域 中 最 优 移动 为 (4，5) ， 该 移动 能 使 目标 值 增 加 6， 
则 目标 函数 值 变 为 c(*) +6 > e(x") ， 优 于 历史 最 优 值 ， 达 到 了 渴望 水 
F, 虽然 这 个 移动 在 禁忌 表 中 ， 仍然 接 受 。 当 前 解 变 为 5 一 2 一 7 一 1 一 
4 一 6 一 3; 当前 值 e(x) =20; 相应 的 ， 历 史 最 优 值 c(**) =20， 修 改 禁 
鼠 表 。 考 察 所 有 移动 对 应 目标 函数 值 的 改善 情况 ， 得 到 状态 如 图 4.7 
所 示 。 
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ah s(x) | 适 配 值 改变 Ac(*) 。 当前 解 <: 5 一 2 一 ?一 1 一 4 一 6 一 3; 
Sg 历史 最 优 值 c(z ) =205 当前 值 (x) =20。 
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图 4.7 7 元 素 排序 问题 第 四 次 选 代 后 状态 

第 5 步 : 邻 域 中 最 优 移动 为 (1，7) ， 不 在 禁忌 表 中 ， 所 以 接受 。 
当前 解 变 为 5 一 2 一 1 一 7 一 4 一 6 一 3; 最 优 值 不 变 。 由 于 已 经 迭代 5 次 
达到 了 预先 设 定 的 最 大 迭代 次 数 ， 算 法 停止 。 最 优 目标 值 为 20， 由 于 
这 次 迭代 没有 改变 目标 函数 值 ， 所 以 得 到 两 个 等 价 的 最 优 解 5 一 2 一 1 一 
7 一 4 一 6 一 3 和 5 一 2 一 7 一 1 一 4 一 6 一 3。 

该 算 例 说 明了 禁忌 搜索 算法 的 基本 思想 : 禁忌 策略 与 渴望 水 平 ， 描 
述 了 简单 禁忌 搜索 算法 的 步 又。 注意 到 ， 禁 鼠 搜索 算法 中 包括 上 一 节 中 
介绍 的 编码 、 初 始 化 、 邻 域 结构 设计 、 选 择 策略 、 禁 忆 表 、 淘 望 水 平 、 
停止 准则 等 概念 。 


4.4 ”中 期 表 与 长 期 表 


4.2 节 给 出 的 是 禁忌 搜索 算法 中 的 一 些 基本 概念 ， 有 了 这 些 概 念 
就 可 以 使 用 禁忌 搜索 算法 来 求解 问题 了 。 禁 忌 搜 索 算法 的 局 域 选 优 能 力 
很 好 ， 邻 域 选 优 速度 快 ， 但 是 广 域 搜索 能 力 较 差 。 而 且 ， 仅 依靠 记录 状 
态 、 状 态 变化 、 状 态 分 量变 化 或 者 适 配 值 变 化 等 对 象 的 禁忌 表 ， 也 就 是 
RR, 禁忌 搜索 算法 不 能 避免 较 大 的 搜索 循环 。 为 此 ,禁忌 搜 索 算法 
中 又 引入 了 中 期 表 和 长 期 表 的 概念 。 

与 短期 表 一 起 ， 中 期 表 和 长 期 表 在 “学 习 式 ”搜索 和 “ 非 学 习 式 ” 
搜索 之 间 起 到 一 个 交互 式 作用 。 使 用 中 期 表 和 长 期 表 ， 可 以 达到 在 区 域 
内 强化 搜索 和 全 局 多 样 化 搜索 的 效果 ， 下 面 分 别 给 出 介绍 。 


4.4.1 中 期 表 


中 期 表 也 称 为 频数 表 或 频率 表 。 禁 鼠 频 数 (频率 ) 是 对 禁忌 属性 
的 一 种 补充 ， 可 以 放宽 选择 决策 对 象 的 范围 。 例 如 ， 如 果 某 个 适 配 值 频 
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繁 出 现 ， 可 以 推测 搜索 陷 人 了 循环 或 者 达到 了 某 个 极 值 点 ， 或 者 说 算法 
当前 参数 很 难 搜索 到 更 好 的 状态 ， 需 要 调整 参数 ， 以 期 望 更 好 的 效果 。 

实际 应 用 中 ， 可 以 根据 问题 和 算法 的 需要 ， 记 录 某 些 状态 出 现 的 频 
率 ， 某 些 状态 变化 或 者 适 配 值 的 变化 信息 ， 而 这 些 信息 可 以 是 静态 的 
也 可 以 是 动态 的 。 

1. 静态 信息 

可 以 记录 搜索 过 程 中 某 些 交换 、 状 态 变 化 或 者 某 些 适 配 值 出 现 的 频 
数 、 频 率 ( 某 对 象 出 现 的 频数 与 总 迭代 次 数 的 比 ) 等 信息 。 对 那些 频 
繁 出 现 的 对 象 进行 惩罚 ， 使 算法 进行 更 为 有 效 的 搜索 。 

以 本 章 开始 时 给 出 的 问题 (P) 为 例 ， 在 不 考虑 中 期 表 的 情况 下 
每 一 次 和 迭代 是 在 候选 解 集中 选择 一 个 目标 函数 值 最 小 的 解 ， 即 

min c(s(x)), s(x) eVCS(x) -T (4.5) 
如 果 考 虑 了 中 期 表 ， 那 么 每 一 次 选 代 是 在 候选 解 集中 选择 目标 函数 值 小 
而 且 被 禁忌 次 数 比较 少 的 解 ， 即 
min e(s(x)) *aN(s(x)), s(x) eVCS(x) -T (4.6) 
其 中 ，N(s(x) ) 为 s(*) 曾 经 被 禁忌 的 频数 ，a 是 惩罚 因子 。 惩 罚 因子 a 
的 取 值 应 该 远 小 于 目标 函数 值 ， 一 般 取 目标 函数 值 的 1% ~ 1%o。 惩 罚 
因子 的 取 值 用 来 平衡 中 期 表 和 短期 表 之 间 的 效果 ，a 取 值 越 大 ， 分 散 的 
效果 越 好 ， 但 是 会 破坏 邻 域 搜索 的 性 能 。 

中 期 表 的 记录 方法 也 有 一 些 技巧 。 以 n 元 素 排序 问题 为 例 ， 可 以 将 
短期 表 与 中 期 表 放 在 一 个 矩阵 中 。 建 立 一 个 ”xm 的 矩阵 ， 其 中 右上 部 
分 作为 短期 表 ， 左 下 部 分 作为 中 期 表 ， 对 角 线 上 元 素 没 有 意义 。 每 一 次 
迭代 ， 将 短期 表 中 大 于 1 的 元 素 减 1 ( 减 至 0 则 该 元 素 退 出 短期 表 )， 
新 加 入 短期 表 的 元 素 置 为 禁忌 长 度 ， 这 样 短期 表 中 始终 有 禁忌 长 度 个 元 
素 ; 而 每 一 次 迭代 ， 中 期 表 中 新 加 入 的 元 素 加 1， 记录 该 元 素 被 禁 尽 的 
次 数 。 对 于 以 上 7 元 素 排序 问题 示例 ， 选 代 3 次 和 4 次 后 的 短期 表 和 中 
期 表 用 这 种 矩阵 表示 分 别 为 
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矩阵 中 没有 列 出 的 元 素 为 0。 这 里 主要 为 了 说 明 这 种 表示 方法 ,没有 考 
虑 引入 中 期 表 后 对 搜索 结果 的 影响 。 

这 种 记录 方法 ， 短 期 表 和 中 期 表 共 用 一 个 矩阵 ， 既 方便 操作 又 节省 
了 存储 空间 。 当 然 ， 当 问题 规模 很 大 时 ， 和 矩阵 中 为 零 的 元 素 个 数 大 大 增 
加 ， 这 个 矩阵 成 为 稀 朴 矩阵 ， 这 种 记录 方法 不 一 定 很 好 ， 中 期 表 和 短期 
表 可 能 需要 分 别 记录 。 

2. 动态 信息 

主要 记录 从 某 些 状态 或 者 适 配 值 等 对 象 转移 到 另 一 些 状态 或 者 适 配 
值 等 对 象 的 变化 趋势 ， 例 如 记录 某 些 序列 的 变化 。 显 然 这 种 中 期 表 需 要 
记录 的 内 容 较 多 ， 而 提供 的 信息 量 也 较 大 。 常 用 的 有 如 下 几 种 记录 
方法 。 

@ 记 录 某 个 序列 的 长 度 。 

@@ 记 录 由 某 个 元 素 出 发 再 回 到 这 个 元 素 需要 的 和 迭代 次 数 。 

图 记录 序列 中 适 配 值 的 平均 值 ， 或 者 序列 中 各 元 素 的 适 配 值 。 

图 记录 某 个 序列 出 现 的 频率 等 。 

记录 这 些 信息 之 后 ， 可 以 对 某 些 序列 进行 惩罚 ， 或 者 采用 更 复杂 的 
处 理 方式 。 

中 期 表 和 短期 表 都 是 基于 已 经 经 历 过 的 搜索 给 出 的 策略 ， 属 于 
“学 习 式 ”搜索 。 


4.4.2 长 期 表 


使 用 短期 表 的 搜索 方式 可 以 认为 是 邻 域 搜索 ， 而 使 用 中 期 表 的 方式 
可 以 认为 是 区 域 强化 式 (Regional Intensification) 搜索 ， 但 仍 可 能 达 不 
到 全 局 搜索 。 为 了 实现 全 局 多 样 化 (Global Diversification) 搜索 ， 提 出 
了 长 期 表 的 概念 。 

长 期 表 用 来 记录 多 个 初始 解 ， 从 这 些 初 始 解 开 始 分 别 进 行 禁 鼠 搜 
索 ， 即 多 阶段 禁忌 搜索 。 产 生 一 个 初始 解 时 ， 应 该 尽量 与 已 经 产生 的 初 
始 解 保持 较 远 的 距离 ， 使 得 各 个 初始 解 在 可 行 域 内 具有 良好 的 分 散 性 ， 


以 更 好 地 在 全 局 进行 搜索 。 
对 于 一 个 n 维 问题 ， 其 中 第 个 初始 解 ** = (at, 2) 可 以 取 
x* = arg max D = arg max? Y (at = xi)? (4.7) 


其 中 ,人 ,leL 为 已 经 选 定 的 初始 解 的 第 i 个 元 素 ， 即 x Gn, xe 
不 同 于 短期 表 和 中 期 表 ， 这 种 长 期 表 不 是 基于 过 去 的 搜索 进行 搜 
索 ， 而 是 在 新 的 区 域内 完全 随机 生成 初始 解 进行 搜索 ， 属 于 “ 非 学 习 
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式 ”搜索 策略 。 使 用 长 期 表 进 行 多 阶段 禁 鼠 搜索 ， 能 很 好 地 提高 算法 
的 广 域 搜索 能 力 ， 同 时 不 丧失 禁忌 搜索 算法 的 邻 域 搜索 能 力 。 

多 阶段 禁忌 搜索 是 后 来 发 展 的 多 种 并 行 禁忌 搜索 中 的 一 种 ， 关 于 并 
行 禁忌 搜索 ， 将 在 后 文 详细 介绍 。 


4.5 算法 性 能 的 改进 


禁忌 搜索 算法 具有 全 局 寻 优 能 力 ， 而 且 比 较 容易 实现 ， 自 从 20 tt 
纪 90 年 代 就 引起 了 广泛 的 重视 。 但 是 应 用 中 也 发 现 ， 以 上 基本 的 禁忌 
搜索 算法 有 一 些 缺 点 ， 对 于 给 定 的 实际 工程 问题 ， 可 能 需要 大 量 的 调试 
工作 才能 得 到 较 好 的 效果 ， 于 是 提出 一 些 改 进 做 法 。 下 面 介 绍 几 种 比较 
主要 的 改进 ， 包 括 并 行 禁忌 搜索 算法 、 主 动 禁忌 搜索 算法 以 及 禁忌 搜索 
算法 和 其 他 算法 的 混合 策略 等 。 


4.5.1 并 行 禁忌 搜索 算法 


随 着 并 行 计 算 技 术 和 并 行 计 算 机 的 发 展 ， 为 满足 求解 大 规模 优化 问 
题 的 需要 ， 禁 鼠 搜 索 算 法 的 并 行 实施 也 得 到 了 研究 与 进展 。 

相对 于 前 面 介绍 的 基本 禁忌 搜索 算法 ， 对 算法 的 初始 化 、 参 数 设 
置 、 通 信 方 式 等 方面 实施 并 行 策略 ， 能 得 到 各 种 不 同类 型 的 并 行 禁忌 搜 
索 算法 。 当 前 ， 对 并 行 禁忌 搜索 算法 比较 认可 的 一 种 分 类 方法 如 图 4.8 
所 示 。 


并 行 禁忌 搜索 算法 


空间 分 解 策略 任务 分 解 策略 


图 4.8 并 行 禁忌 搜索 算法 分 类 


1. 基于 空间 分 解 策 略 

基于 空间 的 分 解 策 略 包括 搜索 空间 分 解 和 邻 域 分 解 两 种 做 法 。 

搜索 空间 分 解 ， 即 通过 搜索 空间 的 分 解 将 原 问题 分 解 为 多 个 子 问 题 
分 别 进行 求解 ， 从 而 实现 并 行 化 。 这 里 求解 各 个 子 问题 的 算法 参数 可 以 
相同 ， 也 可 以 不 同 。 

前 文 介绍 禁忌 搜索 算法 中 基本 概念 “长 期 表 ” 时 ， 提 到 过 多 阶段 
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禁忌 搜索 算法 。 多 阶段 禁忌 搜索 算法 中 ， 首 先 产生 多 个 彼此 距离 比较 远 
的 初始 解 ， 记 录 在 长 期 表 中 ， 然 后 从 这 些 初始 解 出 发 ， 分 多 个 阶段 对 整 
个 问题 进行 搜索 。 如 果 从 这 些 初 始 解 出 发 ， 同 时 进行 搜索 ， 就 是 这 里 讲 
的 一 种 并 行 禁忌 搜索 算法 。 

邻 域 分 解 策略 ， 即 每 一 步 中 用 多 种 方法 对 邻 域 分 解 得 到 的 子 集 进行 
评价 ， 从 而 实现 对 最 佳 邻 域 解 搜索 的 并 行 化 ， 这 种 分 解 策略 对 同步 的 要 
求 比较 高 。 

2. 基于 任务 分 解 策略 

将 待 求解 问题 分 解 为 多 个 任务 ， 每 一 个 任务 使 用 一 个 禁忌 搜索 算法 
来 求解 。 不 同 的 禁忌 搜索 算法 可 以 设置 不 同 的 参数 ， 包 括 初 始 解 、 邻 域 
结构 、 选 择 策略 、 渴 望 水 平等 。 在 多 处 理 机 的 情况 下 ， 根 据 这 些 任务 对 
各 处 理 机 的 分 配 情况 ， 又 可 以 分 为 如 下 三 种 。 

人 @D 非 自 适应 方式 。 任 务 的 数量 和 定位 在 编译 时 就 已 经 确定 ， 各 任务 
在 各 处 理 机 中 的 定位 在 算法 进行 过 程 中 是 不 变 的 ， 也 就 是 静态 的 调度 方 
式 。 例 如 ， 根 据 处 理 机 的 个 数 将 搜索 空间 分 解 为 一 些 子 空间 分 别 进行 搜 
索 。 这 种 方法 中 ， 很 容易 造成 各 处 理 机 之 间 任 务 不 平衡 的 情况 ， 因 而 造 
成 有 些 处 理 机 长 期 处 于 空闲 状态 ， 影 响 搜 索 的 整体 效率 。 但 是 ， 由 于 实 
现 起 来 比较 容易 ， 当 前 大 多 数 并 行 禁忌 搜索 算法 采用 的 都 是 这 种 方式 。 

@ 半 自 适应 方式 。 任 务 的 数量 在 编译 时 给 定 ， 而 各 任务 的 定位 在 运 
行 时 给 定 。 这 种 方式 相对 于 非 自 适应 方式 有 了 一 定 的 改进 ， 运 行 时 可 以 
在 一 定 程度 上 平衡 各 处 理 机 的 负荷 ， 但 仍 不 能 实现 彻底 的 平衡 。 

图 自 适应 方式 。 任 务 的 生成 和 分 配 完全 是 动态 的 ， 是 在 运行 时 给 出 
的 。 当 某 处 理 机 空闲 时 ， 则 生成 新 的 任务 ; 当 处 理 机 繁忙 时 ， 则 取消 某 
任务 。Talbi 等 (1998) 提出 了 一 种 并 行 自 适应 禁忌 搜索 算法 ， 算 法 由 
并 行 而 独立 的 子 禁忌 搜索 算法 构成 ， 各 算法 的 各 种 运行 参数 独立 给 出 而 
且 可 以 不 同 ， 各 任务 之 间 没 有 通信 ， 并 通过 二 次 指派 问题 (QAP) 的 
高 效 求解 验证 了 算法 的 有 效 性 。 

空间 分 解 策略 有 较 强 的 问题 依赖 性 ， 只 对 某 些 问题 适用 ， 而 基于 任 
务 分 解 策略 具有 较 高 的 适用 性 。 当 然 也 可 以 结合 空间 分 解 策略 和 任务 分 
解 策略 ， 设 计 混合 的 并 行 策略 来 求解 问题 。 

董 宏光 等 (2004) 将 并 行 禁忌 搜索 算法 引入 到 化 工行 业 的 精 馆 分 
离 序列 综合 问题 中 。 精 馆 分 离 序列 综合 问题 是 一 种 混合 整数 非 线性 规划 
问题 ， 与 组 合 数学 中 的 一 些 著名 问题 ， 如 是 多边 形 三 角 划 分 、 和 矩阵 链 乘 
等 具有 相同 的 本 质 特征 。 由 于 采用 二 叉 树 模式 简捷 地 描述 了 可 行 分 离 序 
列 ， 算 法 采用 数字 串 形 式 编码 。 算 法 以 相对 费用 函数 为 评价 指标 GE 
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值 函 数 ) ， 当 某 候选 解 优 于 历史 最 优 解 时 ， 无 视 其 禁忌 属性 直接 选 为 下 
一 代 初 始 解 ， 当 所 有 候选 解 都 被 禁忌 时 ， 选 择 最 好 的 候选 解 破 禁 。 当 搜 
索 达 到 最 大 给 定 代数 ， 或 者 在 给 定 代数 内 最 优 值 没有 改进 时 ， 算 法 终 
止 。 最 后 给 出 的 10 组 分 精 馏分 离 序 列 算 例 表明 ， 即 使 随机 给 出 初始 解 ， 
寻 优 结果 通常 也 是 全 局 最 优 的 。 


4.5.2 主动 禁忌 搜索 算法 


1. 基本 禁忌 搜索 算法 的 困惑 

基本 禁忌 搜索 算法 相对 于 传统 的 优化 方法 而 言 ， 具 有 很 好 的 疏 山 能 
力 ， 能 够 避免 陷 人 局 部 最 优点 。 相 对 于 遗传 算法 等 其 他 优化 方法 而 言 ， 
禁忌 搜索 算法 计算 速度 比较 快 ， 因 而 得 到 广泛 的 应 用 。 但 是 ， 对 于 前 面 
介绍 的 基本 禁忌 搜索 算法 ,研究 人 员 过 到 了 一 些 困惑 。 

(1) 参数 调整 比较 困难 。 和 其 他 元 启发 式 算法 包括 遗传 算法 、 模 
拟 退 火 算 法 等 相似 ,禁忌 搜索 算法 需要 设置 或 者 调整 一 些 参数 来 进行 有 
效 的 搜索 。 然 而 要 得 到 合适 的 参数 ， 不 仅 依赖 于 待 求 解 的 具体 问题 ， 而 
且 相 当 费 时 。 因 此 ， 参 数 调整 的 困难 是 各 种 元 启发 式 算法 需要 解决 的 一 
个 突出 问题 。 

基本 禁忌 搜索 算法 中 ， 候 选 解 集 的 大 小 需要 调整 ， 禁 忌 长 度 需 要 设 
定 。 仅 以 禁 鼠 长 度 为 例 ， 尽 管 已 经 做 了 大 量 的 研究 工作 ， 从 起 初 的 与 问 
题 无 关 的 固定 常数 ， 如 5、7、11 等 ;到 依赖 于 问题 规模 n 的 常数 ， 如 Vn; 
到 给 出 禁忌 长 度 的 两 个 极限 ， 形 如 [1，10] ， 或 者 [0.9Yn，1.1Vn] 等 ， 没 
有 哪 一 种 方法 能 适合 于 所 有 问题 ， 而 且 没有 给 出 设 定 这 些 参数 的 理论 依 
据 。 面 对 一 个 给 定 的 实际 问题 ， 常 常 是 经 过 各 种 尝试 ， 最 后 才 得 到 一 种 
可 以 接受 的 方案 。 

(2) 不 能 避免 循环 。 禁忌 表 的 提出 就 是 为 了 尽量 避免 迁 回 搜索 
而 禁忌 表 也 确实 在 很 大 程度 上 避免 了 循环 。 但是， 禁忌 搜索 算法 不 能 避 
免 较 大 的 循环 。 即 使 在 引入 了 中 期 表 和 长 期 表 之 后 ， 也 不 能 彻底 地 避免 
循环 。 当 局 部 最 优点 的 周围 被 一 些 大 的 “吸引 盆 ” 包 围 的 时 候 ， 禁 忌 
搜索 算法 收敛 得 相当 慢 。 

当 禁 忌 搜 索 算法 得 到 一 个 局 部 最 优点 时 ,使 用 禁忌 表 禁 止 刚 访问 过 
的 点 ， 使 得 搜索 逐渐 远离 局 部 最 优点 。 这 里 有 一 个 隐 含 的 假设 : 从 局 部 
最 优点 出 发 ， 而 不 是 从 随机 点 出 发 ， 能 更 容易 地 达到 全 局 最 优点 。 但 
是 ， 研 究 表明 有 时 候 可 能 不 是 这 样 。 

2. 主动 禁忌 搜索 算法 的 基本 原理 

主动 搜索 (Reactive Search, 简称 RS) 是 一 种 反馈 机 制 ， 是 一 种 适 
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合 于 求解 离散 优化 问题 的 启发 式 算法 。Battiti 和 Tecchiolli (1994) 将 主 
动 搜索 机 制 引 入 到 禁忌 搜索 算法 中 来 ， 提 出 了 主动 禁忌 搜索 (Reactive 
Tabu Search, ， 简 称 RTS) 算法 。 

主动 禁忌 搜索 算法 利用 反馈 机 制 自动 调整 禁忌 表 长 度 ， 自 动 平衡 集 
中 强化 搜索 策略 和 分 散 多 样 化 搜索 策略 。 算 法 中 给 出 增 大 调节 系数 Nm 
(Ny >1) 和 减 小 调节 系数 Nor (0 < Nos <1)。 搜 索 过 程 中 ， 所 有 访问 
过 的 解 都 被 存储 起 来 ， 每 当 执行 一 步 移动 时 ， 首 先 检查 当前 解 是 否 已 经 
访问 过 。 如 果 已 经 访问 过 ， 说 明 进 入 了 某 个 循环 ， 禁 鼠 长 度 变 为 原来 的 
Nwit; 如 果 经 过 给 定 的 若干 次 迭代 后 ， 没 有 重复 的 解 出 现 ， 禁 忌 长 度 
变 为 原来 的 Nu fl o 

为 了 避免 循环 ， 主 动 禁忌 搜索 算法 给 出 了 逃逸 机 制 。 搜 索 过 程 中 ， 
当 大 量 解 重复 出 现 次 数 超过 给 定 次 数 Re 时 ， 逃 逸 机 制 便 被 激活 。 逃 逸 
操作 一 般 通过 从 当前 解 执行 若干 步 随机 移动 实现 ， 执 行 移动 的 步 长 在 定 
义 域内 随机 选择 。 为 了 避免 很 快 跳 回 刚 搜索 过 的 区 域 ， 所 有 随机 操作 都 
被 禁止 。 

禁忌 搜索 算法 使 用 历史 记忆 寻 优 ， 用 禁忌 表 指导 优化 搜索 ， 结 合 渴 
望 水 平 ， 系 统 地 实现 了 集中 强化 搜索 和 分 散 多 样 化 搜索 的 平衡 。 而 主动 
禁忌 搜索 算法 则 使 用 反馈 策略 和 逃逸 机 制 来 加 强 这 种 平衡 。 因 此 ， 理 论 
上 说 ， 主 动 禁忌 搜索 算法 比 一 般 的 禁忌 搜索 算法 效果 更 好 ， 搜 索 的 质量 
更 高 。 

3. 主动 禁忌 搜索 算法 的 基本 步骤 

主动 禁 鼠 搜索 算法 的 核心 思想 是 反馈 策略 与 逃逸 机 制 ， 上 面 只 是 给 
出 了 基本 思想 。 实 际 应 用 中 ， 反 馈 策略 与 逃逸 机 制 有 多 种 实现 方法 。 例 
如 : 如 果 num. dec 代 内 没有 重复 解 出 现 ， 则 禁忌 表 长 度 变 为 原来 的 No 
fh; 如 果 重 复 解 出 现 的 总 次 数 (不 是 哪 一 个 解 重复 的 次 数 ， 而 是 所 有 
解 重复 次 数 的 和 ) 达到 num_esc， 则 执行 逃逸 操作 。 主 动 禁忌 搜索 算法 
的 基本 步骤 如 下 : 

第 1 步 : 初始 化 两 个 计数 器 : n_dec =0, n_esc =0。 

第 2 步 : 初始 化 其 他 参数 ， 给 定 初始 解 。 

第 3 步 : 针对 当前 解 ， 给 出 候选 解 集 。 

第 4 步 : 根据 禁忌 表情 况 和 淘 望 水 平 情况 ， 选 出 一 个 解 作 为 下 一 次 
和 迭代 的 初始 解 ， 更 新 记录 表 (包括 正常 的 禁忌 表 和 所 有 访问 过 的 解 ) 。 

第 5 步 : 如 果 该 选中 的 解 出 现 过 ， 则 禁 鼠 长 度 上 =tNnw，n-esc = 
n_esc+1, n_dec=0; Ail] n deco n, dec +1, 

38 62b. WIR n dec-num dec, 则 t=tNos, n. dec 20. 
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第 7 步 : 如 果 n_esc = num_ esc， 则 实施 逃逸 操作 ，n_ esc = 0， 
m_dec=0。 

第 8 步 : 如 果 满 足 停止 准则 ， 则 算法 终止 ; 否则 转 第 3 步 。 

以 上 步骤 主要 用 来 说 明 主动 禁 鼠 搜索 算法 中 提出 的 反馈 机 制 和 逃逸 
操作 ， 至 于 常规 禁忌 搜索 算法 中 包括 的 淘 望 水 平 与 选择 策略 等 ， 这 里 没 
有 详细 描述 。 主 动 禁忌 搜索 算法 的 流程 图 如 图 4.9 所 示 。 从 中 可 以 清楚 
地 看 到 主动 禁忌 搜索 算法 的 核心 思想 ， 看 到 逃逸 机 制 的 触发 条 件 以 及 加 
大 或 者 缩小 禁忌 长 度 的 具体 办 法 。 

4. 主动 禁忌 搜索 算法 的 内 存 管 理 

基本 的 禁忌 搜索 算法 中 ， 需 要 存储 的 内 容 比 较 少 ,禁忌 表 的 长 度 一 
般 不 会 很 长 。 即 便 是 这 样 的 情况 下 ， 存 储 的 空间 与 效率 也 比较 重要 ， 例 
如 上 文 介绍 的 频数 表 和 短期 表 共 用 一 个 矩阵 的 方法 。 实 际 上 ， 关 于 节省 
存储 空间 ， 提 高 访问 速度 方面 还 有 很 多 研究 ， 本 书 没有 详细 介绍 。 


给 出 候选 解 集 ， 针 对 禁忌 表 和 渴望 
水 平 ， 选 出 解 z， 更 新 记录 表格 


图 4.9 主动 禁忌 搜索 算法 的 流程 图 
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主动 禁忌 搜索 算法 中 ， 所 有 访问 过 的 解 都 需要 存储 起 来 ， 这 避免 了 
搜索 的 循环 ， 同 时 可 以 自动 地 调整 禁忌 长 度 ， 能 很 好 地 平衡 集中 强化 搜 
索 与 分 散 多 样 化 搜索 。 但 是 ,事物 都 是 具有 两 面 性 的 ， 主 动 禁忌 搜索 算 
法 中 存储 了 大 量 的 信息 ， 而 且 对 这 些 信息 要 频繁 地 访问 ， 如 果 只 是 使 用 
一 般 的 数组 来 存储 ， 显 然 是 不 够 的 。 为 了 提高 搜索 的 速度 ， 主 动 禁忌 搜 
索 算法 中 一 般 使 用 哈 希 (Hashing) 表 来 存储 这 些 信息 。 

哈 希 技 术 即 对 关键 字 进行 数学 转换 ， 得 到 一 个 位 置信 息 ， 使 得 在 数 
组 或 者 文件 的 这 个 位 置 可 以 检索 到 这 个 数据 的 技术 。 直 观 理解 ， 哈 希 技 
术 就 是 对 关键 信息 “ 切 碎 ”而 后 进行 管理 的 一 种 技术 。 数 学 上 ， 哈 希 
转换 可 以 描述 为 映射 / : 4 一 B， 其 中 |4| > 18|， 通 过 对 较 少 的 数据 8 检 
索 完 成 对 较 大 的 数据 A 的 检索 ， 因 此 提高 了 检索 的 效率 。 同 时 ， 由 于 
14| > 18|， 哈 希 函数 /不 是 一 一 映射 ， 而 是 多 对 一 映射 ， 所 以 有 时 会 
引起 冲突 ， 哈 希 技术 中 有 专门 关于 避免 冲突 等 方面 的 研究 。 关 于 哈 希 技 
术 的 更 详细 描述 超出 了 本 书 的 范围 ， 有 兴趣 的 读者 可 以 参考 相应 关于 数 
据 结构 的 文献 。 

下 面 给 出 一 个 简单 的 例子 来 说 明 哈 希 函数 。 很 多 电台 节目 中 要 记录 
参与 者 的 电话 或 者 手机 号 码 ， 而 这 些 号 码 通常 为 10 多 位 ， 当 数据 量 很 
大 时 ， 检 索 起 来 比较 困难 ; 通常 选取 4 位 尾 号 作为 关键 字 ， 使 用 哈 希 表 
进行 管理 ， 例 如 手机 号 码 130 x x x x 1589 映射 为 1589。 如 果 应 用 得 
好 ， 哈 希 技 术 可 以 大 大 提高 数据 访问 的 效率 。 

主动 禁忌 搜索 算法 中 ， 存 储 的 是 解 的 表达 (编码) 方式 ， 即 映射 
中 的 4， 而 如 果 用 解 的 主要 一 些 配 置信 息 作为 关键 字 构 成 哈 希 函数 ， 即 
映射 中 的 8。 通过 检索 这 些 配置 信息 ， 可 以 很 快 地 找到 相应 的 解 。 

除了 使 用 哈 希 表 来 管理 这 些 存储 的 解 之 外 ， 还 可 以 使 用 二 叉 树 等 方 
R, REAR. 

5. 主动 禁忌 搜索 算法 的 应 用 

Battiti 和 Tecchiolli 提出 主动 禁忌 搜索 算法 的 时 候 ， 针 对 0-1 背包 
问题 和 大 规模 的 二 次 指派 问题 (QAP) 对 算法 进行 测试 ， 取 得 了 很 好 
的 效果 。 而 后 ， 主 动 禁 忌 搜 索 算法 已 经 在 很 多 领域 得 到 了 成 功 的 应 用 ， 
包括 旅行 商 问题 (TSP) 、 车 间 调 度 、 车 辆 路 径 问 题 (VRP), HAR 
参数 调整 以 及 电力 系统 中 有 功 /无 功 控制 等 领域 ， 也 有 人 用 来 求解 函数 
优化 问题 ， 国 内 关于 主动 禁忌 搜索 算法 的 研究 与 应 用 还 比较 少 。 

主动 禁忌 搜索 算法 主要 思想 是 利用 反馈 机 制 自动 调整 禁忌 长 度 和 逃 
侈 机 制 来 避免 循环 。 事实 上 ， 具 有 这 样 思想 的 禁忌 搜索 算法 都 可 能 称 为 
主动 禁忌 搜索 算法 ， 而 且 主动 禁忌 搜索 算法 还 可 以 包括 其 他 方面 关于 禁 
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尽 搜索 算法 的 改进 ， 例 如 并 行 的 主动 禁忌 搜索 算法 等 。 

虽然 主动 禁忌 搜索 算法 目前 还 处 于 发 展 阶段 ,但 是 可 以 预见 ， 随 着 
应 用 领域 的 扩大 和 研究 的 深入 ， 主 动 禁忌 搜索 算法 作为 一 种 鲁 棒 性 很 强 
的 元 启发 式 算法 ， 必 将 得 到 长 足 的 发 展 。 


4.5.3 ”禁忌 搜索 算法 与 遗传 算法 混合 的 搜索 策略 


近年 来 ， 混 合 优化 策略 得 到 了 广泛 的 应 用 ,并 取得 了 很 好 的 效果 ， 
其 设计 与 分 析 已 经 成 为 算法 研究 的 一 个 热点 。 本 小 节 首 先 简要 介绍 混合 
优化 策略 的 研究 与 应 用 情况 ， 然 后 给 出 禁忌 搜索 算法 和 遗传 算法 的 混合 
优化 策略 。 

1. 混合 优化 策略 

随 着 工程 技术 的 发 展 和 问题 范围 的 拓宽 ， 问 题 的 规模 和 复杂 度 越 来 
越 大 ， 传 统 算法 的 优化 效果 往往 不 够 理想 ， 同 时 算法 理论 研究 的 沾 后 也 
导致 了 单一 算法 性 能 改进 程度 的 局 限 性 。 基 于 这 种 情况 ， 算 法 混合 的 思 
想 已 经 成 为 提高 算法 优化 性 能 的 重要 且 有 效 的 途径 。 

近年 来 ， 有 学 者 分 析 了 遗传 算法 、 禁 忌 搜索 算法 以 及 本 书后 面 章节 
要 介绍 的 模拟 退火 算法 、 蚁 群 优化 算法 、 粒 子 群 优化 算法 等 元 启发 式 算 
法 的 特点 ， 并 统称 为 广义 的 邻 域 搜索 算法 。 广 义 邻 域 搜索 算法 是 相对 于 
梯度 下 降 法 等 传统 的 邻 域 搜索 算法 而 言 的 ， 为 构造 新 的 优化 算法 提供 了 
一 个 框架 ， 其 中 包括 如 下 6 个 方面 的 要 素 

人 @@ 搜 索 机 制 是 构造 算法 框架 和 实现 优化 的 关键 ， 是 决定 算法 搜索 行 
为 的 根本 点 。 

@ 搜 索 方 法 决定 着 优化 的 结构 ， 即 每 代 有 多 少 解 参 与 优化 。 

图 邻 域 函 数 决 定 了 邻 域 结 构 和 邻 域 解 的 生产 方式 。 

图 状态 更 新 方式 即 如 何 从 旧 状态 中 确定 新 的 当前 状态 ， 是 决定 算法 
整体 优化 特性 的 关键 步骤 之 一 。 

回 控制 参数 必须 以 一 定 的 方式 进行 修改 ， 以 适应 算法 性 能 的 变化 。 

@ 停 止 准则 决定 了 算法 的 最 终 优 化 性 能 。 

通过 分 析 广 义 邻 域 搜索 的 关键 要 素 ， 又 提出 了 广义 邻 域 搜索 的 统一 
结构 ， 这 对 算法 混合 策略 的 研究 以 及 设计 新 的 算法 具有 一 定 的 指导 
意义 。 

当前 关于 混合 优化 算法 的 应 用 已 经 比较 广泛 ， 其 中 混合 进去 的 算法 
包括 传统 的 优化 算法 以 及 各 种 启发 式 算法 和 元 启发 式 算法 。 例 如 ， 模 拟 
退火 -单纯 形 算法 混合 优化 策略 、 遗 传 - 模拟 退火 算法 混合 优化 策略 、 
禁忌 搜索 - 遗传 算法 混合 优化 策略 等 ， 还 包括 三 种 或 者 三 种 以 上 算法 的 
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混合 。 应 用 领域 包括 函数 优化 、 组 合 优化 、 神 经 网 络 设计 等 各 个 领域 。 

2. 禁忌 搜索 算法 和 遗传 算法 的 局 限 性 

禁忌 搜索 算法 的 优越 性 使 这 个 算法 得 到 了 广泛 的 应 用 ， 同 时 禁忌 搜 
索 算法 的 一 些 局 限 性 也 促进 了 禁忌 搜索 算法 与 其 他 算法 混合 优化 策略 的 
产生 与 发 展 。 众 多 禁忌 搜索 算法 与 其 他 算法 的 混合 策略 中 ， 这 里 只 介绍 
禁忌 搜索 - 遗传 算法 混合 策略 。 介 绍 之 前 ， 首 先 回顾 一 下 这 两 种 算法 的 
缺陷 。 

(1) 遗传 算法 的 局 限 性 

尽管 遗传 算法 能 够 胜任 任意 函数 高 维 空间 组 合 优化 问题 ， 但 是 对 于 
大 规模 神经 网 络 的 结构 和 权 值 的 优化 等 超大 规模 的 优化 问题 ， 遗 传 算法 
的 应 用 就 受到 了 限制 。 究 其 原因 ， 主 要 是 遗传 算法 每 一 代 都 要 维持 一 个 
较 大 规模 的 种 群 ， 对 整个 种 群 的 存储 与 访问 占用 了 大 量 的 空间 和 时 间 
当 问 题 规模 相当 大 时 ， 这 样 大 的 时 间 和 空间 开销 是 无 法 接受 的 。 

遗传 算法 还 有 一 个 缺点 是 “早熟 " 。 造 成 遗传 算法 早熟 的 原因 有 两 
个 : 其 一 便 是 遗传 算法 中 的 交叉 算 子 。 交 叉 算 子 使 得 种 群 中 的 染色 体 之 
间 具 有 局 部 相似 性 ， 可 能 导致 搜索 停滞 不 前 。 其 二 是 遗传 算法 中 的 变异 
概率 一 般 比 较 低 ， 变 异 操作 带 来 的 种 群 多 样 性 一 般 不 够 ， 而 主要 呈现 出 
的 是 交叉 操作 带 来 的 种 群 相似 性 。 

此 外 ， 由 于 变异 操作 的 “力度 不 够 ”"， 遗 传 算 法 的 息 山 能 力 一 般 较 
差 ， 因 此 如 何 提高 息 山 能 力也 成 为 遗传 算法 的 一 个 主要 研究 方面 。 

(2) 禁忌 搜索 算法 的 缺憾 

相对 于 遗传 算法 ， 禁 鼠 搜 索 算法 具有 较 快 的 收敛 速度 ， 但 是 禁忌 搜 
索 算 法 的 搜索 性 能 较 大 地 依赖 于 给 定 的 初始 解 。 一 个 较 好 的 初始 解 往往 
使 禁忌 搜索 算法 很 快 收敛 于 全 局 最 优 解 ， 而 一 个 较 差 的 初始 解 可 能 极 大 
的 降低 算法 的 收敛 速度 。 因 此 ， 应 用 中 往往 使 用 其 他 启发 式 算法 给 出 一 
个 较 好 的 初始 解 ， 来 提高 禁忌 搜索 算法 的 性 能 。 

禁忌 搜索 算法 的 另外 一 个 缺憾 是 算法 的 串 行 性 。 算 法 初始 时 是 一 个 
解 而 不 是 一 个 种 群 ， 迁 代 过 程 也 只 是 从 一 个 解 移动 到 另外 一 个 解 ， 而 不 
是 一 个 种 群 到 另外 一 个 种 群 。 相 对 于 遗传 算法 等 并 行 算法 而 言 ， 禁 鼠 搜 
索 算 法 的 串 行 性 导致 全 局 搜索 能 力 有 待 提高 ， 也 正 因为 如 此 才 出 现 了 
4.4.1 节 中 并 行 禁忌 搜索 算法 的 出 现 。 

3. 禁忌 /遗传 混合 策略 的 基本 思想 

最 早 把 记忆 功能 引入 到 遗传 算法 中 的 是 Muhlenbein， 从 一 个 很 宽广 
的 范围 对 遗传 算法 和 禁忌 搜索 算法 进行 了 分 析 和 比较 ， 指 出 了 二 者 进行 
混合 的 可 能 性 以 及 理论 基础 ， 但 并 未 提出 具体 的 混合 方法 。Reeves 把 
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禁忌 搜索 算法 的 多 样 化 思想 引入 到 遗传 算法 的 交叉 和 变异 中 ， 并 使 得 搜 
索 过 程 具有 记忆 性 ， 收 到 了 很 好 的 效果 。 而 后 ， 禁 鼠 搜 索 - 遗传 算法 混 
合 搜索 策略 (简称 禁忌 /遗传 混合 策略 ) 得 到 了 较为 广泛 的 应 用 。 

禁忌 /遗传 混合 策略 中 ， 由 于 遗传 算法 的 广 域 搜索 能 力 较 强 ， 一 般 
作为 “ 主 算法 ”; 由 于 禁忌 搜索 算法 的 局 部 搜索 能 力 较 强 ,一 般 作为 
“从 算法 ”。 主 算法 和 从 算法 的 概念 并 不 是 针对 两 个 算法 的 重要 性 ， 而 
是 这 样 的 混合 算法 从 整体 看 来 比较 像 一 般 的 遗传 算法 ， 而 其 中 的 实现 方 
法 上 又 带 有 禁忌 搜索 算法 的 思想 。 目 前 应 用 较 多 的 禁忌 /遗传 混合 策略 
主要 包括 两 种 形式 ， 典 人 禁忌 搜索 的 遗传 算法 和 引入 禁忌 搜索 思想 的 遗 
传 算法 ， 下 面 分 别 给 出 介绍 。 

(1) 嵌入 禁忌 搜索 的 遗传 算法 

这 种 混合 策略 中 ， 完 整 的 禁忌 搜索 算法 被 嵌 人 在 遗传 算法 中 。 遗 传 
算法 的 每 一 步 迭 代 中 ， 要 进行 一 次 或 者 数 次 的 完整 禁忌 搜索 (而 不 是 
一 次 或 数 次 禁忌 搜索 迭代 ) 。 遗 传 算法 息 山 能 力 比 较 弱 主要 是 由 于 变异 
操作 造成 的 ， 所 以 这 种 策略 中 一 般 使 用 禁忌 搜索 算法 代替 变异 操作 。 使 
用 禁忌 搜索 取代 了 标准 变异 算 子 之 后 ， 这 个 算 于 一 般 称 为 禁忌 搜索 变异 
算 子 ， 记 为 TSM 算 子 。 

这 种 使 用 了 TSM 算 子 的 遗传 算法 的 一 般 步骤 可 以 描述 为 : 

第 1 步 : 初始 化 算法 ， 给 出 算法 中 各 参数 ， 并 初始 化 种 群 。 

第 2 步 ; 判断 遗传 算法 的 停止 准则 是 否 满足 。 如 果 满 足 ， 停 止 算 
法 ， 输 出 结果 ， 否 则 继续 以 下 步骤 。 

第 3 步 : 基于 当前 种 群 进行 选择 操作 ， 例 如 使 用 轮 盘 财 方法。 

第 4 步 : 进行 交叉 操作 ， 更 新 种 群 和 最 优 状 态 。 

第 5 步 : 使 用 TSM 算 子 变异 : 

子 步骤 5 -1: 对 于 每 一 个 染色 体 ， 生 成 0，1 之 间 的 随机 数 ">， 如 
Erap, (其 中 pu 为 变异 概率 ) ， 则 对 该 染色 体 进行 TSM 变异 ， 否 则 考 
虑 下 一 个 染色 体 。 

FERS -2: 初始 化 禁忌 搜索 算法 ， 当 前 染色 体 即 为 初始 解 。 

子 步骤 5 -3: 判断 禁忌 搜索 算法 迭代 准则 是 否 满足 。 如 果 满足 结 
东 禁 忌 搜索 ， 进 入 第 6 步 ， 否 则 继续 以 下 步骤 。 

FERS -4: 产生 候选 解 集 。 

子 步骤 5 -5: 根据 设 定 的 渴望 水 平和 禁忌 表情 况 ， 选 择 一 个 解 ， 
并 更 新 禁忌 表 。 

FERS -6: 转子 步骤 5 -3。 

第 6 步 : 以 新 的 种 群 返回 第 2 步 ， 继 续 遗 传 算法 。 
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敌人 禁忌 搜索 的 遗传 算法 和 一 般 遗 传 算法 大 部 分 都 是 一 样 的 ， 所 以 
上 述 步骤 中 没有 对 其 中 的 编码 方式 、 初 始 化、 选择 方法 、 交 叉 方 法 等 环 
节 做 详细 描述 ， 这 些 环节 的 确定 以 及 种 群 大 小 、 和 迭代 次 数 、 交 叉 和 变异 
概率 等 参数 的 给 出 已 经 在 第 3 章 详细 介绍 过 了 。 

其 入 禁忌 搜索 的 遗传 算法 中 的 禁忌 搜索 部 分 和 一 般 的 禁忌 搜索 也 是 
一 样 的 ， 包 括 其 中 的 候选 解 集 的 确定 、 禁 忌 长 度 的 给 出 以 及 渴望 水 平 的 
选择 等 都 没有 特殊 要 求 。 但 是 ， 在 这 里 禁忌 搜索 只 是 一 个 被 嵌入 的 算 
法 ， 主 要 用 于 邻 域 搜索 。 因 此 ， 算 法 的 参数 设置 上 可 以 适当 加 重 邻 域 搜 
索 的 力度 ， 例 如 一 般 不 用 中 期 表 和 长 期 表 ， 和 迭代 次 数 也 不 宜 过 大 。 

(2) 引入 禁忌 搜索 思想 的 遗传 算法 

与 嵌入 禁忌 搜索 的 遗传 算法 不 同 ， 这 种 混合 策略 只 是 把 禁忌 搜索 算 
法 的 “禁忌 ”与 “特赦 ”思想 引入 到 遗传 算法 中 来 ， 对 遗传 算法 中 的 
交叉 或 者 变异 操作 进行 一 定 的 改进 。 遗 传 算法 的 选择 策略 中 有 “精英 
保留 ”策略 ， 主 要 是 为 了 把 性 能 良好 的 染色 体 直接 保留 到 下 一 代 。 引 
入 禁忌 搜索 思想 后 ， 不 但 可 以 实现 “精英 保留 "， 而 且 具 有 记忆 功能 
限制 了 个 体 被 替换 的 频率 。 这 种 思想 一 般 用 于 改进 交叉 算 子 ， 改 进 后 的 
交叉 算 子 称 为 TSR 算 子 。 

具有 TSR 算 子 的 遗传 算法 可 以 描述 为 

第 1 步 : 初始 化 算法 ， 给 出 算法 中 的 各 参数 ， 并 初始 化 种 群 。 

第 2 步 ， 判断 遗传 算法 的 停止 准则 是 否 满足 。 如 果 满 足 ， 停 止 算 
法 ,输出 结果 ， 否 则 继续 以 下 步骤 。 

第 3 步 : 基于 当前 种 群 进行 选择 操作 ， 例 如 使 用 轮 盘 赌 方 法 。 

第 4 步 : 使 用 TSR 算 子 进行 交叉 : 

子 步骤 4 -1: 对 于 每 一 个 染色 体 ， 生 成 0，1 之 间 的 随机 数 r， 如 
果 r<p。( 其 中 p. 为 交叉 概率 )， 则 该 染色 体 被 选中 ,否则 没有 选中 。 
如 此 选 出 父 代 染 色 体 。 

子 步骤 4-2: 对 每 对 父 代 染 色 体 进行 交叉 操作 ， 产 生 两 个 子 代 。 

子 步骤 4 -3: 以 父 代 染 色 体 平 均 适 配 值 为 渴望 水 平 ， 以 染色 体 的 
适 配 值 为 禁忌 对 象 ， 禁 鼠 表 具有 一 定 的 长 度 。 

子 步骤 4-4: 如 果子 代 染 色 体 适 配 值 优 于 渴望 水 平 ， 则 破 禁 ， 无 
论 其 是 否 被 禁忌 ， 该 子 代 染 色 体 都 进入 下 一 代 ; 否则 进入 下 一 步 。 

子 步骤 4 -5: 如 果子 代 染 色 体 没有 被 禁忌 ， 则 该 染色 体 进入 下 一 
fü; 否则 进入 下 一 步 。 

子 步骤 4 -6: 选择 最 好 的 父 代 染 色 体 进入 到 下 一 代 中 。 

第 5 步 : 进行 变异 操作 。 


110 第 4 章 禁忌 搜索 算法 


第 6 步 : 以 新 的 种 群 返回 第 2 步 ， 继 续 遗 传 算法 。 

可 见 ， 以 上 混合 策略 中 ， 交 叉 操 作 采 取 了 “禁忌 ”与 “ 破 禁 ” 的 
思想 ， 这 是 禁忌 搜索 的 基本 思想 ; 但 是 又 没有 典 人 完整 的 禁忌 搜索 算 
法 ， 没 有 使 用 诸如 邻 域 移动 等 操作 ， 所 以 称 为 “引入 禁忌 搜索 思想 的 
遗传 算法 ”。 

TSR 算 子 的 核心 思想 就 是 : 交叉 产生 的 子 代 中 ， 对 于 比较 优秀 的 ， 
直接 进入 下 一 代 ， 无 论 其 禁忌 状态 如 何 ， 即 达到 了 渴望 水 平 〈 父 代 适 
配 值 的 平均 值 ) 。 对 于 一 般 的 染色 体 ， 即 不 能 达到 渴望 水 平 的， 那么 如 
果 被 禁忌 了 ， 宁 愿 选择 父 代 染 色 体 。 这 样 可 以 保持 种 群 的 多 样 性 ， 吉 免 
算法 的 早熟 。 至 于 经 典 遗传 算法 中 讲 的 各 种 交叉 算 子 ， 根 据 问题 的 需要 
可 以 随意 选择 ， 例 如 可 以 选择 单 点 交叉 或 者 双 点 交叉 、 与 运算 交叉 或 者 
或 运算 交叉 等 ， 这 样 的 任何 交叉 算 子 引入 了 禁忌 搜索 思想 后 ， 都 可 以 称 
作 TSR 算 子 。 

禁忌 /遗传 混合 策略 还 可 以 有 其 他 的 形式 ， 例 如 同时 使 用 TSR 算 子 
和 TSM 算 子 等 。 

4. 禁忌 /遗传 混合 策略 的 应 用 情况 

早 在 1993 4E, Fox 等 就 混合 禁忌 搜索 和 遗传 算法 来 模拟 马尔 可 夫 
链 ，Glover 等 (1994) 认为 : 尽管 禁忌 搜索 算法 和 遗传 算法 有 很 大 的 区 
jl, 但 有 一 些 内 在 联系 ,并且 可 以 在 很 大 范围 内 混合 两 种 算法 来 进行 优 
化 。 而 后 ,禁忌 /遗传 混合 优化 策略 得 到 了 广泛 的 应 用 ， 包 括 预 警卫 星 
传感器 调度 、 防 空 作战 中 的 目标 分 配 问 题 、 通 信 系统 中 的 最 佳 多 用 户 检 
测 问 题 、 带 有 时 间 窗 的 车 辆 路 径 问 题 、 可 变 加 工时 间 的 工件 调度 问题 、 
电力 系统 的 资源 分 配 和 电压 控制 以 及 聚 类 分 析 等 领域 。 而 且 ， 混 合算 法 
日 益 成 为 研究 的 热点 ， 应 用 范围 日 益 广泛 。 


4.5.4 其 他 改进 方法 


以 上 介绍 了 并 行 禁忌 搜索 算法 、 主 动 禁忌 搜索 算法 以 及 禁忌 /遗传 
混合 优化 策略 ， 这 些 策略 很 好 地 改进 了 禁忌 搜索 算法 的 性 能 ， 应 用 的 范 
围 也 比较 广泛 。 除 此 之 外 ， 还 有 许多 基于 禁忌 搜索 算法 的 改进 算法 ， 这 
些 算 法 也 能 较 好 地 改进 搜索 性 能 ， 但 大 部 分 问题 依赖 性 都 比较 强 ， 应 用 
范围 因此 受到 一 定 限制 ， 下 面 给 出 几 个 例子 。 

1. 基于 其 他 方法 构造 初始 可 行 解 

上 文 已 经 多 次 提 到 ， 禁 忌 搜索 算法 的 性 能 在 较 大 程度 上 依赖 于 初始 
解 的 质量 。 为 了 提高 算法 收敛 的 速度 ， 提 高 解 的 质量 ， 很 多 场合 下 初始 
解 不 是 随机 生成 的 ， 而 是 基于 其 他 算法 给 出 的 。 
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例如 方 永 厅 等 人 使 用 插 人 法 生成 高 质量 的 初始 解 ， 然 后 利用 禁 鼠 搜 
案 算法 寻 优 ; 当 禁 忌 搜索 算法 的 最 优 解 经 过 很 多 次 迭代 都 不 能 得 到 改善 
时 ,基于 当前 解 利 用 插入 法 重新 构造 搜索 起 点 ， 从 而 能 很 快 地 跳出 原来 
的 搜索 路 径 而 从 不 同 的 方向 进行 搜索 。 经 过 典型 优化 问题 TSP 问题 验 
证 ， 这 种 基于 插入 法 的 混合 算法 具有 很 好 的 收敛 性 和 寻 优 能 力 。 贾 永基 
等 人 也 使 用 插入 法 构造 初始 解 ， 进 而 使 用 禁忌 搜索 算法 求解 货运 车 辆 调 
度 问 题 。 

kB $2 Bl dU ff AA (Insertion Method， 简 称 IM) 是 一 种 构造 性 启 
发 式 算法 ， 最 早 是 由 Rosenkrantz 等 人 为 构造 某 一 度量 空间 中 的 一 条 访 
问 回路 而 提出 ， 后 来 已 经 从 算法 复杂 性 的 角度 证 明 这 种 算法 用 来 生成 高 
质量 的 初始 解 时 具有 很 大 的 优越 性 。 

2. 快速 局 部 搜索 结合 禁忌 搜索 的 算法 

当 邻 域 规模 比较 大 时 ， 如 果 遍 历 整个 邻 域 选择 最 优 解 然后 根据 禁忌 
表 和 渴望 水 平 来 完成 一 次 迭代 ， 则 邻 域 搜索 时 间 将 比较 长 。 这 个 情况 
下 ， 可 以 将 邻 域 的 一 部 分 作为 候选 解 集 来 加 快 邻 域 搜索 ， 也 可 以 引入 其 
他 启发 式 算法 来 加 快 邻 域 搜索 。 

一 种 快速 局 部 搜索 (Fast Local Search， 简 称 FLS) 算法 将 邻 域 空间 
划分 为 多 个 子 邻 域 ， 并 在 邻 域 上 设置 活动 标志 。 活 动 标志 为 0 的 子 邻 域 
称 为 活动 子 邻 域 ， 是 待 搜索 的 子 邻 域 ; 活动 标志 为 - 1 的 子 邻 域 称 为 不 
活动 子 邻 域 ， 是 不 用 搜索 的 子 邻 域 。 初 始 时 所 有 子 邻 域 的 标志 都 是 0， 
如 果 搜索 完 某 个 子 邻 域 没 有 找到 任何 更 好 的 邻居 ， 那 么 该 子 邻 域 的 活动 
标志 置 为 -1， 和 否则 该 子 邻 城 的 活动 标志 保持 为 0。 随 着 解 的 不 断 改 进 ， 
活动 的 子 邻 域 越 来 越 少 ， 搜 索 的 速度 越 来 越 快 。 直 至 所 有 子 邻 域 活动 标 
志 都 为 -1， 则 找到 了 局 部 最 优 解 ， 邻 域 搜索 结束 。 

页 永基 等 人 将 这 种 快速 局 部 搜索 算法 引入 到 禁忌 搜索 算法 中 来 ， 并 
巧妙 地 根据 带 时 间 窗 车 辆 装卸 货 问题 的 特点 ， 在 客户 和 路 径 的 对 应 关系 
上 设置 活动 标志 ， 将 表示 活动 标志 信息 的 矩阵 和 禁忌 表 合 二 为 一 。 通 过 
测试 ， 在 保证 解 的 质量 没有 变化 的 情况 下 ， 搜 索 时 间 大 大 减少 ， 表 明 这 
种 混合 禁忌 搜索 算法 的 有 效 性 。 

3. 带 回访 功能 的 禁忌 搜索 算法 

Eugeniusz 提出 了 一 种 带 回访 功能 的 禁忌 搜索 算法 ， 主 要 思想 是 每 
当 历史 最 优 解 得 到 改进 时 ， 保 存 与 这 个 解 有 关 的 信息 。 当 算法 迭代 了 预 
先 给 定 的 一 定 代数 而 最 优 解 没有 改进 时 ， 回 跳 到 已 经 保存 的 有 改进 解 的 
位 置 ， 取 出 与 这 个 解 有 关 的 信息 ， 从 该 点 开始 对 未 搜索 的 邻 域 进行 搜 
索 。 重 复 上 述 步 又 ， 直 至 搜索 完 所 有 区 域 。 
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这 一 方法 的 缺点 是 : 在 预先 给 定 的 步 数 内 找到 的 很 多 解 是 重复 的 
浪费 了 很 多 的 时 间 。 为 了 解决 这 个 问题 ， 童 刚 等 人 引入 哈 希 技术 保存 访 
间 过 的 解 ， 改 进 带 回访 功能 的 禁忌 搜索 算法 ,并 针对 job - shop 问题 验 
证 了 算法 的 性 能 ， 关 于 使 用 哈 希 技术 管理 访问 过 的 解 的 具体 方法 这 里 不 
再 详 述 。 

4. 结合 启发 式 的 禁忌 搜索 算法 

胡杨 等 人 针对 并 行 多 机 成 组 工件 极 小 化 通过 时 间 的 调度 问题 ， 提 出 
了 禁忌 搜索 结合 启发 式 ( 记 为 TSHEU) 的 算法 ,并 对 比 了 禁忌 搜索 结 
合 分 枝 定 界 ( 记 为 TSB&B) 算法 ， 表 明 两 种 算法 都 是 有 效 的 ， 而 
TSHEU 算法 速度 更 快 。 

并 行 多 机 成 组 工件 极 小 化 通过 时 间 问 题 属于 一 类 工件 调度 问题 ， 其 
中 成 组 调度 的 基本 思想 是 : 不 同 工 件 按 其 相似 性 分 为 若干 个 组 ; 加工 
中 ， 一 个 工件 接 在 同 组 工件 之 后 不 需要 重新 准备 ， 而 接 在 不 同 组 工件 之 
后 必须 重新 准备 。 这 个 问题 属于 NP 难题 ， 一 般 启发 式 算法 难以 用 到 具 
有 实际 意义 的 大 型 问题 中 。 

针对 单机 流水 时 间 问 题 的 最 优 性 条 件 和 合理 调度 的 性 质 (关于 单 
机 调度 的 这 些 定义 与 性 质 ; 本 文 略 ) ， 衣 杨 等 人 提出 了 效果 很 好 的 启发 
式 算法 ， 并 将 该 算法 与 禁忌 搜索 算法 结合 求解 上 面 的 多 机 问题 。 搜 索 过 
程 中 根据 给 出 的 启发 式 算法 可 以 很 容易 地 判断 出 某 个 解 是 否 为 邻 域 最 优 
解 ， 而 不 需要 像 一 般 问题 那样 通过 遍历 邻 域 来 判断 最 优 性 ， 极 大 地 节省 
了 搜索 时 间 。 

5. 其 他 改进 算法 与 混合 算法 

关于 禁忌 搜索 的 改进 算法 还 有 很 多 ， 可 以 对 标准 禁忌 搜索 算法 的 各 
个 基本 环节 进行 改进 ， 包 括 初始 解 的 确定 方法 、 各 参数 的 设 定 与 调整 方 
案 、 邻 域 搜索 策略 等 。 例 如 刘 江 华 等 人 将 极 大 似 然 加 速算 子 引 入 到 禁忌 
搜索 算法 中 ， 每 迭代 一 定 次 数 ， 进 行 一 次 极 大 似 然 加 速 操作 ， 也 就 是 基 
于 某 种 概率 进行 局 部 搜索 ， 很 大 程度 上 加 快 了 禁忌 搜索 的 收敛 。 

禁 鼠 搜索 算法 与 其 他 算法 的 混合 算法 也 还 有 很 多 ， 例 如 禁忌 搜索 算 
法 与 粒子 群 算法 (PSO) 混合 、 禁 鼠 搜索 算法 与 贝 叶 斯 优化 算法 混合 
等 。 限 于 篇 幅 ， 在 此 不 能 一 一 列举 ， 而 且 与 禁忌 搜索 算法 混合 的 有 些 算 
法 可 能 要 在 本 书后 面 章节 中 给 出 介绍 。 

4.4.4 节 中 介绍 的 各 种 改进 或 混合 算法 ， 一 般 具 有 较 强 的 问题 依赖 
性 ， 其 中 的 优化 策略 或 者 参数 设 定常 常 是 根据 特定 的 问题 给 出 的 ， 不 容 
易 移 植 到 其 他 问题 中 ,或 者 移植 了 效果 也 会 下 降 。 或 者 由 于 其 他 原因 ， 
这 些 算法 到 目前 还 没有 得 到 很 广泛 的 应 用 。 
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4.4.1 ~4.4.3 节 介 绍 的 算法 相对 来 讲 通 用 性 比较 好 。 这 些 算法 主 
要 针对 禁忌 搜索 算法 本 身 的 一 些 缺 点 进行 改进 ,包括 : 针对 串 行 搜索 引 
和 人 并行 机 制 ， 针 对 禁忌 长 度 的 设 定 缺 乏 理论 依据 引入 反馈 机 制 ， 针 对 不 
能 避免 较 大 循环 引入 逃逸 机 制 ， 等 等 。 这 些 方面 和 待 求解 的 优化 问题 无 
关 ， 因 此 这 些 改 进 算法 得 到 了 较为 广泛 的 应 用 ， 而 且 应 用 范围 还 有 扩大 
的 趋势 。 

此 外 ， 对 于 特定 的 问题 而 言 ， 通 用 性 好 的 算法 一 般 不 会 是 性 能 最 好 
的 ， 因 为 通用 的 算法 不 可 能 考虑 给 定 问题 的 特征 。 如 果 问 题 有 特殊 的 要 
求 ， 例 如 计算 时 间 要 求 很 短 ， 或 者 必须 求 得 全 局 最 优 解 ， 那 么 应 该 针对 
特殊 问题 的 特殊 要 求 ， 修 改 那些 比较 通用 的 算法 ， 或 者 重新 设计 新 的 求 
解 算法 。 例 如 中 国 象棋 人 机 博弈 中 通常 就 采用 穷 举 搜索 ， 只 是 穷 举 方法 
上 使 用 了 分 枝 定 界 等 技术 而 不 是 蛮 力 搜索 而 已 。 如 果 问 题 没有 特殊 的 要 
求 ， 则 可 以 直接 使 用 那些 比较 通用 的 优化 方法 求解 。 


4.6 禁忌 搜索 算法 的 应 用 


禁忌 搜索 算法 是 一 种 有 效 的 组 合 优化 求解 算法 ，Glover 最 早 也 是 针 
对 组 合 优化 问题 提出 的 这 种 算法 。 但 是 ， 近 年 来 禁忌 搜索 算法 的 应 用 范 
围 得 到 了 拓宽 ,包括 函数 优化 〈 实 优化 ) 和 多 目标 优化 问题 的 求解 等 ， 
下 面 分 别 给 出 介绍 。 


4.6.1 应 用 于 实 优化 问题 


1992 年 Hu 首先 将 禁忌 搜索 算法 扩展 到 函数 优化 领域 ， 之 后 用 禁忌 
搜索 算法 求解 函数 优化 问题 得 到 了 一 定 的 关注 ， 而 且 现在 还 在 发 展 
之 中 。 

1. 主要 技术 问题 

使 用 禁忌 搜索 算法 求解 函数 优化 问题 ， 首 先 要 解决 的 问题 是 邻 域 的 
表征 。 函 数 优化 中 ， 当 前 解 * 的 邻 域 通常 定义 为 以 x 为 中 心 、r 为 半径 
的 球 ， 记 为 B(x,r) ， 从 而 所 有 满足 条 件 |x' x] er 的 点 *' 都 是 x 的 邻 
域 解 ， 其 中 | * | 表示 范 数 。 同 时 ,为 了 使 得 n 个 邻 域 解 在 整个 邻 域内 
分 布 得 比较 均匀 ， 可 以 再 定义 以 x 为 中 心 、 分 别 以 mm ， nsns ra 
半径 的 -1 个 同心 球 ， 将 邻 域 分 割 为 7 个 子 邻 域 ， 在 每 一 个 子 邻 域 中 
产生 一 个 点 。 这 样 ，* 的 m 个 邻 域 解 为 I ras le-ar, i= 
1, =, n}, P r 80, r, =ro 

以 上 使 用 分 割 球 的 方法 得 到 邻 域 解 的 过 程 中 ， 计 算 量 比较 大 ， 而 且 
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邻 域 解 的 个 数 不 好 给 出 。 更 为 简便 的 做 法 是 采用 超 立 方 体 代替 球 
即 对 当前 解 x = (sns n) (n 为 解 的 维 数 ) 的 分 量 x (Lenin) 做 
如 下 变换 : 

x mx s (4.8) 
其 中 ，s 为 步 长 。 根 据 需 要 ，s 可 以 随 迭 代步 数 的 变化 而 变化 ， 也 可 以 
针对 不 同 的 分 量 取 不 同 的 值 。 

此 外 ， 由 于 状态 〈 或 状态 变化 ) 以 及 适 配 值 〈 函 数值 ) 是 连续 的 ， 
关于 是 否 被 禁忌 的 判断 与 求解 离散 问题 也 不 同 。 这 里 ， 通 常 在 禁忌 对 象 
的 一 定 范围 内 都 认为 是 禁忌 的 ， 例 如 禁忌 对 象 的 0. 01% 等 。 

2. 简化 禁忌 搜索 算法 用 于 实 优化 

所 谓 简化 禁忌 搜索 算法 ， 即 不 考虑 所 有 邻 域 解 都 被 禁忌 的 情况 和 淘 
望 水 平 。 使 用 简化 禁忌 搜索 算法 求解 实 优化 问题 min f(x), xe E" 的 基 
本 步 又 可 以 描述 为 如 下 。 

第 1 步 : 随机 给 出 初始 可 行 解 x>， 历 史 最 优 解 *”= *， 和 迭代 次 数 


第 2 步 : 如 果 达 到 最 大 和 迭代 次 数 ， 输 出 结果 ， 停 止 算法 ， 否 则 继续 
以 下 步骤 。 

第 3 步 : 产生 邻 域 D， 并 计算 邻 域 解 的 适 配 值 。 

第 4 步 : 选择 不 被 禁忌 的 最 好 解 z，x =x*，k =k+1， 更 新 禁忌 表 。 

第 5 步 : 如 果 f(x) «f(x )， 则 x”=x; 否则 继续 以 下 步骤 。 

第 6 步 : 返回 第 2 步 继续 搜索 。 

从 以 上 步骤 可 以 看 出 ， 简 化 禁忌 搜索 算法 中 以 设置 最 大 代数 为 停止 
准则 ， 以 选中 的 解 为 禁忌 对 象 ， 当 然 ， 如 果 某 个 解 与 禁忌 表 中 某 元 素 的 
差 小 于 给 定 范围 ， 也 认为 是 被 禁忌 的 。 这 样 的 算法 简单 明了 ， 容 易 实 
现 ， 而 且 与 用 于 组 合 优化 的 禁忌 搜索 算法 也 十 分 相似 ， 主 要 的 区 别 是 其 
中 邻 域 的 确定 。 

这 个 算法 中 ， 按 式 (4.8) 给 出 邻 域 ， 其 中 的 步 长 * 按 

t'ar (4.9) 
规律 变化 ， 其 中 , AARRE, r 为 给 定常 数 ， Fk URRY SHE 
拟 退 火 算法 中 的 S 的 含义 类 似 ，* =c, Hho <c <1 为 步 长 的 减 小 
比例 。 

施文 俊 等 人 认为 这 个 算法 中 的 步 长 * 下 降 速 度 过 慢 ， 导 致 搜索 广度 
大 而 精度 不 足 。 于 是 将 整个 选 代 过 程 分 为 数 轮 ， 每 经 过 一 轮 * 的 值 减少 
一 个 数量 级 ， 采 用 分 轮 速 降 的 方法 协调 广度 与 精度 的 矛盾 ， 最 后 使 用 化 
工 邻 域 中 的 换 热 网 络 优化 问题 进行 了 验证 。 
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3. 具有 自 适 应 机 制 的 禁忌 搜索 算法 用 于 实 优化 

集中 性 搜索 与 多 样 性 搜索 始终 是 禁 鼠 搜索 算法 运行 的 焦点 ， 这 在 上 
文 已 经 多 次 提 到 。 集 中 性 搜索 用 于 对 当前 搜索 到 的 较 好 解 的 邻 域 进行 进 
一 步 的 搜索 ， 以 便 达 到 全 局 最 优 解 ， 多样 性 搜索 用 于 拓宽 搜索 区 域 ， 尤 
其 是 没有 搜索 过 的 区 域 。 当 搜索 陷 人 局 部 最 优 时 ， 多 样 性 搜索 能 改变 搜 
索 方 向 ， 跳 出 局 部 最 优 和解。 集中 人 性 搜索 与 多 样 性 搜索 是 重要 的 ， 但 又 是 
矛盾 的 ， 如 何 协调 这 对 矛盾 是 应 用 禁 鼠 搜索 算法 的 一 个 难点 。 针 对 这 个 
问题 ， 已 经 开展 了 大 量 的 研究 工作 ， 例 如 前 文 介绍 的 主动 禁忌 搜索 算法 
利用 反馈 机 制 调整 禁忌 长 度 来 协调 集中 性 与 多 样 性 。 

贺 一 等 人 提出 了 另 一 种 协调 集中 性 与 多 样 性 的 策略 。 这 种 自 适应 策 
略 中 ， 将 邻 域 和 候选 解 集 分 为 两 个 部 分 ， 一 部 分 是 集中 性 元 素 ， 用 于 集 
中 搜索 ; 另 一 部 分 是 多 样 性 元 素 ， 用 于 多 样 性 搜索 。 邻 域 中 集中 性 元 素 
的 产生 办 法 和 一 般 禁 忌 搜索 算法 中 邻 域 的 产生 办 法 相似 ， 而 多 样 性 元 素 
则 不 同 ， 常 常 是 随机 产生 。 候 选 解 集中 的 集中 性 元 素 按 最 优 性 选取 ， 而 
多 样 性 元 素 则 仍 随机 选取 。 

算法 开始 之 前 ， 候 选 解 集中 的 集中 性 元 泰 占 元 素 总 数 的 一 半 。 和 迭代 
过 程 中 ， 集 中 性 元 素 个 数 DL 动态 地 改变 。 如 果 本 次 迭代 得 到 的 当前 最 
优 解 优 于 上 一 次 迭代 得 到 的 最 优 解 ， 则 DL = DL + 1; 如 果 本 次 迭代 得 
到 的 最 优 解 等 于 或 劣 于 上 一 次 迭代 得 到 的 最 优 解 ， 则 DL = DL-3. 5 
外 ， 无 论 什 么 时 候 ， 候 选 解 集中 都 要 存在 集中 性 元 素 和 多 样 性 元 素 ， 至 
少 保留 一 个 。 

当 解 的 质量 有 提高 时 ， 候 选 解 集中 的 集中 性 元 素 增多 ， 相 应 的 进行 
集中 性 搜索 的 概率 也 增 大 ; 反之 ， 当 解 的 质量 没有 提高 时 ， 候 选 解 集中 
的 多 样 性 元 素 增多 ， 相 应 的 多 样 性 搜索 的 概率 也 增 大 。 这 样 ， 根 据 搜索 
中 的 解 的 具体 情况 动态 地 调整 集中 性 搜索 与 多 样 性 搜索 的 比例 ， 较 好 地 
解决 了 这 一 对 矛盾 。 针 对 TSP 问题 ,将 具有 这 种 自 适应 能 力 的 禁忌 搜 
索 算法 与 其 他 文献 上 的 神经 网 络 的 算法 进行 了 比较 ， 多 数 情况 下 这 种 禁 
鼠 搜 索 算 法 优 于 神经 网 络 算法 。 

由 于 这 种 策略 不 需要 问题 的 特殊 信息 ， 很 容易 应 用 于 其 他 问题 的 求 
解 。 贺 一 等 人 用 带 这 种 策略 的 禁忌 搜索 算法 优化 神经 网 络 中 的 权 值 和 阔 
值 。 其 中 一 些 关键 环节 介绍 如 下 。 

O) 禁忌 对 象 : 优化 问题 的 目标 函数 为 神经 网 络 实际 输出 与 目标 
输出 的 相对 平均 偏差 ， 即 


-1S T0) -00)| 
fe IY x 100% (4.10) 
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Ht, n 为 样本 点 个 数 ，T(i) 和 0(i 分 别 为 第 i 个 样本 点 的 目标 函数 
值 和 实际 输出 值 。 以 目标 函数 值 /为 禁忌 对 象 ， 当 候选 解 的 目标 函数 值 
在 禁忌 表 中 某 元 素 周 围 的 一 个 很 小 的 区 间 (例如 +0.01% ) 时 即 被 
Kg. 

(2) 邻 域 结 构 : 在 神经 网 络 当前 权 值 和 阅 值 〈( 即 当前 解 ) 每 一 个 
元 素 的 基础 上 加 上 一 个 修正 量 ， 形 成 一 个 邻 域 解 。 最 大 修正 量 记 为 
max_offset， 修 正 量 在 这 个 最 大 值 之 内 均匀 地 随机 生成 。 

(3) 自 适 应 策略 : 对 于 集中 性 元 素 ， 最 大 修正 量 取 很 小 的 值 ， 例 
如 +0.05 ~ +0.1, 便于 在 该 区 域 集中 搜索 ; 对 于 多 样 性 元 素 ， 最 大 修 
正 量 取 较 大 值 ， 例 如 取 + 上 0.4 ~ +2.0。 其 他 方面 完全 按 上 述 自 适应 策略 
实现 。 

使 用 这 种 禁忌 搜索 算法 训练 神经 网 络 ， 与 用 BP 算法 训练 神经 网 络 
做 了 比较 ,测试 函数 为 正弦 函数 和 sinc BHC f(x) = sin(x)/x， 结 果 这 种 
算法 的 优越 性 十 分 明显 。 

这 种 禁忌 搜索 算法 的 核心 思想 是 引入 了 集中 性 元 素 和 多 样 性 元 素 的 
概念 ， 并 根据 搜索 的 具体 情况 自动 调整 两 种 元 素 的 比例 ， 很 好 地 解决 了 
集中 性 与 多 样 性 之 间 的 矛盾 。 

4. 增强 连续 禁忌 搜索 算法 

Chelouah 等 (2000) 提出 了 一 种 增强 连续 禁忌 搜索 算法 ， 记 为 
ECTS。 和 前 文 介绍 的 具有 自 适应 机 制 的 禁忌 搜索 算法 相似 ，ECTS 也 万 
其 强调 集中 搜索 和 分 散 化 搜索 的 重要 性 。 简 要 地 讲 ，ECTS 框架 包括 3 
个 主要 部 分 ， 即 分 散 搜索 、 最 有 希望 区 域 搜索 、 集 中 强化 搜索 。 因 此 ， 
增强 连续 禁忌 搜索 算法 的 主要 步 又 可 以 描述 为 图 4. 10 所 示 的 流程 图 。 
算法 的 这 3 个 主要 步骤 是 连续 的 ， 前 一 个 步 又 的 结果 为 后 一 个 步骤 做 准 
备 ， 或 者 可 能 就 是 后 一 步 要 搜索 的 范围 〈 定 义 域 ) ， 后 一 步 搜索 是 前 一 
步 的 继续 和 强化 。 算 法 的 3 个 主要 步骤 又 比较 相似 ， 每 一 个 主要 步骤 都 
可 以 认为 是 一 个 独立 的 禁忌 搜索 算法 。 下 面 对 这 3 个 主要 部 分 分 别 做 
介绍 。 

(1) 分 散 化 搜索 

分 散 化 搜索 中 除了 禁忌 表 外 ， 又 引 人 了 “希望 表 ” 的 概念 。 禁 忌 
表 中 存放 过 去 一 定 次 数 迭 代 中 接受 的 邻 域 解 ， 而 希望 表 中 存放 搜索 到 
的 有 希望 区 域 。 首 先 给 定 初始 解 ， 按 前 面 介 绍 的 分 割 超 方 体 的 方法 得 
到 规定 个 数 的 邻 域 解 ， 选 择 那些 既 不 在 禁忌 表 中 又 不 在 希望 表 中 的 最 
优 邻 域 解 ， 作 为 下 一 次 和 迭代 的 当前 解 。 如 此 反复 搜索 ， 当 目标 函数 出 
现 了 不 可 接受 的 恶化 时 ， 便 开始 搜索 新 的 有 希望 区 域 ， 而 这 时 当前 解 
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就 被 认为 是 这 个 有 希望 区 域 的 中 心 ， 记 录 在 希望 表 中 。 和 希望 表 和 禁忌 
表 相似 ， 也 有 一 个 给 定 的 长 度 ， 当 新 的 有 希望 区 域 进入 希望 表 时 ， 最 
差 的 (注意 : 不 是 最 早 的 ) 有 希望 区 域 从 希望 表 中 退出 。 如 果 规 定 步 
数 内 没有 发 现 新 的 有 希望 区 域 ， 则 停止 分 散 化 搜索 ， 进 入 最 有 希望 区 
RER. 


FEIE: EEK 
分 艇 化 搜索 ， 得 到 项 望 表 


根据 希望 表 ， 进 行 最 有 希望 区 域 搜索 


在 最 有 希望 区 域 中 进行 集中 搜索 


图 4.10 ECTS 的 基本 流程 


注意 : 产生 邻 域 时 使 用 的 超 方 体 方法 ， 便 于 实现 ;而 判断 一 个 解 是 
否 被 禁忌 时 使 用 的 是 禁忌 球 方法 ， 即 判断 该 解 与 禁忌 对 象 的 距离 是 否 在 
给 定 距离 之 内 ， 这 两 者 是 有 区 别 的 。 

可 以 看 到 ， 这 个 过 程 就 是 一 个 禁忌 搜 索 ， 而 且 是 比较 复杂 的 禁忌 搜 
索 。 其 中 希望 表 中 存储 的 可 以 理解 为 算法 的 结果 ， 只 是 这 里 不 只 保留 一 
个 结果 ， 而 是 保留 了 规定 个 数 (希望 表 长 度 ) 个 最 优 结果 。 禁 鼠 表 和 
希望 表 的 同时 使 用 ， 有 效 地 激励 搜索 远离 初始 点 ， 避 人 免 迁 回 搜索 ， 从 而 
很 好 地 实现 了 分 散 化 搜索 。 

(2) 最 有 希望 区 域 搜索 

分 散 化 搜索 中 已 经 得 到 了 一 个 希望 表 ， 这 是 “最 有 希望 区 域 搜索 ” 
的 开始 区 域 ， 禁 忌 表 已 经 没有 意义 。 最 有 和 希望 区 域 搜索 的 主要 步 又 
如 下 。 

第 1 步 : 计算 希望 表 中 所 有 解 的 目标 函数 值 的 平均 值 。 

第 2 步 : 删除 希望 表 中 目标 函数 值 高 于 平均 值 的 解 ， 即 比较 差 
的 解 。 

第 3 步 : 将 禁忌 球 半径 和 超 方 体 邻 域 大 小 减 半 ， 对 留 下 来 的 有 希望 
解 执行 “产生 邻 域 解 ， 选 出 最 优 解 ”的 操作 过 程 。 如 果 最 优 解 优 于 产 
生 它 的 那个 有 希望 解 ， 则 使 用 该 最 优 解 蔡 换 当初 的 有 希望 解 ， 否 则 不 赫 
换 。 如 此 对 整个 希望 表 扫 描 完毕 。 
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第 4 步 : 如 果 还 剩 下 多 个 有 希望 区 域 ， 转 第 1 步 继续 搜索 ;否则 
结束 。 

(3) 集中 搜索 

集中 搜索 是 针对 “最 有 希望 区 域 搜索 ”得 到 的 最 有 希望 区 域 进行 
的 ， 是 又 一 轮 的 搜索 。 集 中 搜索 的 步骤 可 以 描述 如 下 : 

第 1 步 : 清空 禁忌 表 ， 初始 化 迄 代 步 数 等 参数 。 

第 2 步 : 对 当前 解 执 行 “产生 邻 域 解 ， 选 出 最 优 非 禁忌 解 ， 更 新 
禁忌 表 ” 的 操作 。 

第 3 步 : 如 果 目 标 函 数值 在 规定 迭代 次 数 内 得 到 了 改善 ， 转 第 2 步 
反复 搜索 ; 否则 继续 以 下 步 又 。 

第 4 步 : 如 果 目 标 函 数值 在 规定 迭代 次 数 内 没有 改善 或 者 达到 了 规 
定 的 迭代 步 数 ， 则 算法 停止 ， 否则 将 超 方 体 邻 域 大 小 和 禁忌 球 半径 减 
半 ， 转 第 1 步 反 复 搜索 。 

可 以 看 到 ， 这 只 是 一 个 非常 简要 的 描述 ， 其 中 一 句 话 “ 产 生 邻 域 
解 ， 选 出 最 优 非 禁忌 解 ， 更 新 禁忌 表 ” 几 乎 相当 于 标准 禁忌 搜索 算法 
的 全 过 程 。 因 此 ， 分 散 化 搜索 ， 最 有 希望 区 域 搜索 、 集 中 搜索 都 是 很 复 
杂 的 禁忌 搜索 过 程 ， 而 整个 的 ECTS 框架 的 复杂 程度 可 想 而 知 。 

当然 ，ECTS 框架 中 具有 为 数 众 多 的 参数 ， 包 括 一 些 初始 化 参数 和 
控制 参数 ， 而 这 些 参 数 中 有 些 需 要 用 户 给 出 ， 有 些 需 要 通过 计算 得 到 ， 
有 些 参数 需要 根据 问题 规模 设 定 ， 等 等 。 关 于 这 些 参数 的 详细 设置 方法 
本 书 不 展开 讨论 ， 有 兴趣 的 读者 可 以 查阅 相关 文献 。 

禁忌 搜索 算法 用 于 实 优化 ， 可 以 是 非常 简单 的 基本 禁忌 搜索 算法 ， 
也 可 以 是 很 复杂 的 ECTS 框架 。 对 于 特定 的 问题 ， 读 者 需要 根据 具体 情 
况 灵活 运用 禁忌 搜索 算法 来 解决 。 


4.6.2 应 用 于 多 目标 优化 问题 


现实 生活 中 ,很 多 问题 都 具有 不 止 一 个 目标 函数 ， 称 为 多 目标 优化 
问题 ， 本 小 节 介 绍 禁 忌 搜 索 算法 应 用 于 多 目标 优化 的 情况 。 


1. 多 目标 优化 问题 
一 般 的 ， 多 目标 优化 问题 可 以 描述 为 
min/max F(X) (4.11) 
stXeS-|XI XeA',g(X) <a,h(X) <bli=l,,m,j=1,,n 
Ab, RRM X Ion HM, FOX) =X), AOD) H kE 


目标 函数 向 量 ，S 为 可 行 解 的 集合 ， 带 有 m 个 不 等 式 约束 和 n 个 等 式 约 
R, a 和 b, 为 常数 。 对 于 连续 型 变量 ,4 = R; 对 于 离散 型 变量 ,4 为 
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可 行 取 值 的 集合 。 目 标 函 数 P(X) 可 以 是 极 大 化 ， 也 可 以 是 极 小 化 ， 
但 是 两 者 容易 转化 ， 为 了 讨论 问题 方便 ， 下 面 讨 论 中 只 考虑 极 小 化 情 
OL, Bl min F(X), RIEA TPR. 

多 目标 优化 问题 中 的 目标 通常 是 矛盾 冲突 的 ， 这 导致 问题 的 最 优 解 
通常 不 止 一 个 ， 而 是 多 个 ， 而 这 样 的 “最 优 解 ” 也 不 是 通常 意义 上 的 
最 优 解 ， 而 是 Pareto 最 优 解 〈 优 化 解 ) Pareto 最 优 解 ， 也 称 为 非 受 控 
(Non - Dominated) 解 ， 定 义 如 下 : 

一 个 解 X" eS 是 Pareto 最 优 解 ， 当 且 仅 当 不 存在 XeS 满足 

f(X) SAX), isl, c, k; B 

Qf.(X) «(C ), 3ie(l, =, k} 

换 句 话说 ， 如 果 没 有 一 个 解 能 改善 目标 函数 的 某 个 分 量 而 不 破坏 任何 一 
个 分 量 ， 那 么 这 个 解 就 是 Pareto 最 优 解 。 既 然 没 有 哪个 解 能 比 Pareto 最 
优 解 更 优 ， 求 解 多 目标 优化 问题 时 就 应 该 寻找 尽 可 能 多 的 Pareto 最 
优 解 。 

2. 多 目标 问题 求解 方法 

传统 的 求解 多 目标 问题 的 方法 具有 一 定 的 局 限 性 ， 这 是 与 这 些 方法 
的 本 质 与 生 俱 来 的 。 传 统 方法 通常 依赖 于 目标 函数 的 类 型 (如 线性 或 
非 线性 等 ) 以 及 决策 变量 的 类 型 (如 整数 或 者 实数 ) 等 。 影 响 算法 性 
能 的 因素 很 多 ， 包 括 解 空间 的 规模 、 约 束 和 决策 变量 的 个 数 ， 以 及 解 空 
间 的 结构 (如 凸 的 或 非 凸 的 ) 等 。 到 目前 为 止 ， 没 有 一 种 传统 的 方法 
能 求解 任何 变量 类 型 、 任 何 约束 和 目标 函数 形式 的 多 目标 问题 。 例 如 ， 
单纯 形 法 只 能 求解 目标 函数 和 约束 变量 都 是 线性 的 情况 ， 几 何 规划 只 能 
求解 多 项 式 形式 或 者 符号 变量 目标 函数 的 问题 。 然 而 ,现实 中 的 多 目标 
问题 常常 具有 多 种 变量 形式 、 复 杂 的 目标 函数 以 及 约束 条 件 ， 传 统 的 方 
法 不 能 满足 实际 问题 的 需要 。 

在 过 去 ， 实 际 问题 必须 描述 成 一 种 特定 的 传统 方法 能 够 求解 的 形 
式 ， 然 而 这 是 不 容易 的 。 为 了 能 够 求解 ， 很 多 实际 问题 需要 经 过 大 量 的 
假设 或 者 修改 ， 例 如 : 变量 的 取 整 (离散 化 ) ， 放 松 约束 ， 某 种 程度 上 
做 近似 处 理 ， 等 等 ， 这 必然 会 影响 到 解 的 质量 。 为 了 解决 传统 优化 方法 
中 的 这 些 问题 ， 提 出 了 一 系列 不 依赖 于 问题 的 启发 式 算法 ， 例 如 本 书 介 
绍 的 禁忌 搜索 算法 、 遗 传 算法 、 模 拟 退火 算法 等 。 这 个 时 候 ， 只 需要 对 
这 些 算法 做 少许 修改 ， 就 可 以 解决 各 种 实际 问题 ，Adil 等 把 这 个 过 程 描 
述 为 图 4. 11 所 示 的 形式 。 
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传统 优化 方法 问题 依赖 | 


如 果 是 线性 规划 问题 ， 可 以 使 用 单纯 形 法 ; 
如 果 是 整数 规划 问题 ， 可 以 使 用 分 枝 定 界 法 ; 


现代 启发 式 优化 方法 非 问题 依赖 


任意 问题 , 可 以 使 用 遗传 算法 ; 
任意 问题 , 可 以 使 用 禁忌 搜索 算法 ; 
We 任意 问题 , 可 以 使 用 蚁 群 算法 ; 


图 4.11 现代 算法 与 传统 算法 的 区 别 


使 用 禁忌 搜索 算法 求解 多 目标 问题 ， 最 简单 的 一 个 思路 就 是 通过 引 
入 权重 机 制 ， 将 多 目标 问题 化 为 单 目标 问题 ， 然 后 求解 。 这 种 做 法 完全 
属于 多 目标 问题 的 处 理 ， 求 解 所 用 的 禁忌 搜索 算法 与 普通 的 禁忌 搜索 算 
法 没有 任何 区 别 。Gandibleux 等 (1997) 提出 了 一 种 基于 权重 和 分 级 函 
数 (Scalarizing Functions) 的 多 目标 禁忌 搜索 算法 ,并 用 来 求解 组 合 优 
化 问题 。Hansen (2000) 提出 一 种 包含 多 个 解 向 量 的 禁忌 搜索 算法 ， 
每 个 解 向 量 都 有 自己 的 禁忌 表 ， 并 引入 权重 来 引导 搜索 达到 非 支 配 面 。 
Ehrgott 和 Gandibleux 关于 应 用 禁忌 搜索 算法 求解 多 目标 问题 给 出 了 精彩 
的 综述 ， 这 里 不 展开 讨论 ， 只 在 下 面 小 节 中 介绍 一 种 非常 巧妙 的 多 目标 
禁忌 搜索 MOTS 算法 。 

3. 多 目标 禁忌 搜索 MOTS 算法 

禁忌 搜索 算法 在 每 一 步 选 代 过 程 中 ， 都 要 产生 多 个 邻 域 解 ， 从 中 根 
据 禁 鼠 准 则 和 渴望 水 平 来 产生 下 一 步 迭 代 的 初始 解 ， 正 是 受 这 个 特点 的 
启发 ，Baykasoglu 等 (1999) 提出 了 一 种 新 的 多 目标 禁忌 搜索 MOTS 算 
法 。Baykasoglu 等 认为 : 类 似 禁忌 搜索 算法 这 样 ， 凡 是 在 求解 的 过 程 中 
要 同时 处 理 多 个 解 的 算法 ， 包 括 每 代 都 保留 一 个 种 群 的 遗传 算法 ， 都 可 
以 很 容易 用 来 求解 多 目标 优化 问题 。 

MOTS 中 ， 除 了 基本 禁忌 搜索 算法 中 的 禁忌 表 之 外 ， 引 入 了 另外 两 
MK, 分 别 是 Pareto 表 (Pareto List) 和 候选 表 (Candidate List), Pare- 
to 表 用 来 收集 搜索 到 的 Pareto 最 优 解 ， 其 中 的 Pareto 最 优 解 都 曾经 用 来 
作为 种 子 解 (Seed Solution) 来 产生 邻 域 解 。 候 选 表 用 来 暂时 存放 搜索 
到 的 其 他 非 受 控 解 ， 如 果 在 后 续 的 迭代 中 ， 它 们 仍然 保持 “ 非 受 控 ” 


4.6 禁忌 搜索 算法 的 应 用 121 


状态 ， 可 能 作为 种 子 解 而 进入 Pareto 表 。MOTS 算法 与 一 般 禁 鼠 搜索 算 
法 的 其 他 主要 区 别 是 解 的 选择 与 更 新 策略 ,下面 对 MOTS 算法 中 几 个 关 
键 环节 给 出 介绍 。 

(1) 初始 解 

和 其 他 禁忌 搜索 算法 一 样 ， 随 机 给 出 或 用 其 他 算法 产生 一 个 可 行 初 
始 解 。 

(2) 邻 域 解 的 产生 

根据 变量 性 质 的 不 同 ， 例 如 连续 的 、 离 散 的 、0 -1 变量 等 ， 邻 域 
解 的 产生 方法 不 同 ， 这 与 一 般 禁 鼠 搜 索 算 法 没有 什么 区 别 。 但 是 有 一 点 
不 同 ， 产 生 的 这 给 定 个 数 的 邻 域 解 必须 是 不 受 控 于 种 子 解 ( 当前 解 ) 
的 ， 因 为 搜索 的 目标 就 是 要 寻找 Pareto 解 ， 当 然 这 些 邻 域 解 也 要 非 禁 忌 
的 。 要 达到 这 一 点 ， 可 以 使 用 最 简单 的 产生 方法 ， 也 可 以 使 用 其 他 复杂 
的 策略 ， 如 变 结构 策略 等 。 

这 种 邻 域 产 生 原 则 相当 于 不 接受 劣 解 ， 而 用 下 面 介绍 的 候选 表 来 避 
免 循环 。 这 一 点 与 普通 禁忌 搜索 算法 是 不 同 的 ， 普 通 禁忌 搜索 算法 的 一 
个 主要 特点 就 是 接受 劣 解 。 

(3) 种 子 解 的 选择 

选择 种 子 解 的 核心 策略 是 Pareto 最 优 性 策略 。Pareto 最 优 性 是 一 个 
经 济 学 上 的 概念 ， 直 观 地 可 以 这 样 理解 : 如 果 一 个 解 是 Pareto 最 优 的 ， 
那么 没有 如 下 这 样 的 解 存在 : 至 少 有 一 个 分 量 比 这 个 解 更 优 ， 而 没有 一 
个 分 量 比 这 个 解 更 差 。 种 子 解 的 选择 包括 如 下 步骤。 

第 1 步 : 对 于 每 个 邻 域 解 ， 计 算 目标 函数 值 。 

第 2 步 : 从 邻 域 解 中 选择 候选 解 ， 候 选 解 要 求 相对 于 所 有 其 他 邻 域 
$F. Pareto 表 中 的 解 和 候选 表 中 的 解 是 Pareto 最 优 的 。 

第 3 步 : 从 候选 解 中 随机 选择 一 个 作为 种 子 解 。 如 果 没 有 候选 解 ， 
则 从 候选 表 中 选择 一 个 最 “ 老 ” 的 〈 最 早 进 入 候选 表 的 ) 解 作为 种 
子 解 。 

(4) 各 种 表 的 更 新 

当 搜索 开始 时 ,初始 解 作为 Pareto 最 优 解 放 人 Pareto RP, ERE 
程 中 ， 相 对 于 其 他 邻 域 解 而 言 ， 不 再 具有 Pareto 最 优 性 的 解 从 Pareto 表 
(或 候选 表 ) 中 移 除 。 选 中 的 种 子 解 加 入 到 Pareto 表 中 ， 而 如 果 还 有 其 
他 候选 解 ， 则 加 入 到 候选 表 中 。 以 种 子 解 为 禁忌 对 象 ， 关 于 禁忌 表 的 设 
置 和 操作 与 普通 禁忌 搜索 一 样 。 

Pareto 表 和 候选 表 的 长 度 没有 限制 ， 这 一 点 与 禁忌 表 是 不 同 的 。 任 
何 一 个 解 不 会 因为 在 这 两 个 表 中 时 间 太 长 了 而 退出 ， 凡 是 被 移 除 的 解 ， 
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都 是 因为 已 经 不 再 是 Pareto 最 优 解 了 ，Parete 表 和 候选 表 以 及 邻 域 中 都 
是 这 样 。 

(5) 渴望 水 平 

一 般 的 禁忌 搜索 用 于 离散 问题 的 时 候 ， 禁 忌 对 象 不 是 解 本 身 ， 而 是 
解 的 某 些 属性 ， 或 者 称 为 状态 改变 。 这 种 情况 下 ， 同 样 的 禁忌 对 象 ， 作 
用 于 不 同 的 当前 解 ， 得 到 的 是 不 同 的 新 解 ， 完 全 可 能 带 来 优 于 历史 最 优 
解 的 解 。 为 了 避免 漏 掉 这 样 的 解 〈 或 者 叫做 搜索 区 域 ) ， 需 要 设置 海 望 
水 平 。 而 如 果 将 整个 解 作为 禁忌 对 象 ， 同 样 的 解 不 可 能 带 来 不 同 的 目标 
函数 值 ， 没 有 必要 设置 渴望 水 平 ， 禁 鼠 搜 索 算法 用 于 实 优化 时 通常 都 是 
这 样 。 

(6) 停止 准则 

如 果 达 到 了 预先 设 定 的 最 大 选 代 次 数 ， 或 者 候选 表 为 空 算法 无 法 找 
到 下 一 个 种 子 解 ， 则 算法 停止 。 

为 了 进一步 说 明 种 子 解 的 产生 和 各 种 表 的 更 新 ， 给 出 一 个 简单 的 例 
子 。 两 个 目标 函数 需要 最 大 化 ， 决 策 变量 为 二 维 实数 ， 邻 域 大 小 取 3。 
设 当前 种 子 解 向 量 为 (4.8，4.6)， 目 标 函 数值 向 量 为 (52.40, 
40.93); 产生 的 3 个 邻 域 解 为 (6.3, 6.1)、 (6.0, 6.0) 和 (6.4, 
6.0), ， 对 应 目标 函数 值 分 别 为 〈60. 08 47.09), (58.79, 46.54) 和 
(60.39, 46.86), ， 可 见 所 有 邻 域 解 相 对 于 种 子 解 都 是 Pareto 最 优 的 。 下 
面 选择 候选 解 。 从 3 个 邻 域 解 来 看 ， 目 标 函 数值 为 (58.79，46.54) 
的 解 不 是 Pareto 最 优 的 〈 两 个 分 量 都 劣 于 其 他 解 ) ， 划 掉 ， 另 外 两 个 不 
相互 受 控 。 如 果 再 对 照 Pareto 表 和 候选 表 ， 目 标 值 为 (60.08 47.09) 
和 (60.39, 46.86) 的 邻 域 解 还 是 Pareto 最 优 的 ， 则 这 两 个 都 是 候选 
解 。 将 Pareto 表 和 候选 表 中 所 有 不 再 具有 Pareto 最 优 性 的 解 移 除 ， 从 这 
两 个 候选 解 中 任意 选择 一 个 作为 种 子 解 加 入 Pareto 表 中 ， 另 一 个 加 入 候 
选 表 中 。 此 外 ， 选 出 的 种 子 解 还 要 加 入 禁忌 表 中 ， 禁忌 表 中 最 “ 老 ” 
的 元 素 退 出 禁忌 表 ， 这 和 一 般 禁忌 搜索 算法 一 样 。 

MOTS 算法 的 计算 流程 如 图 4. 12 所 示 。 

与 其 他 应 用 禁忌 搜索 算法 求解 多 目标 优化 问题 的 方法 不 同 ， 这 个 
MOTS 算法 框架 不 需要 任何 关于 各 目标 函数 之 间 的 权重 信息 ， 不 需要 将 
多 目标 函数 化 为 单一 目标 函数 ， 而 是 直接 利用 禁忌 搜索 算法 的 结构 进行 
搜索 。 而 且 ， 其 他 应 用 于 多 目标 的 禁忌 搜索 算法 都 比 普通 禁忌 搜索 算法 
( 单 目 标 ) 额外 需要 一 些 参数 ， 而 MOS 算法 没有 任何 额外 的 参数 需要 
设置 。 

in MOTS 算法 用 于 实 优化 ， 则 生成 邻 域 的 步 长 和 邻 域 的 大 小 对 算 
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初始 化 : 
给 出 可 行 解 作 为 种 子 解 , 并 加 入 禁 
忌 表 和 Pareto 表 中 , MARES 


FERRE: 
根据 s 产 生 m 个 不 在 禁忌 表 中 且 相对 
于 s 为 Pareto 最 优 的 邻 域 解 


确定 候选 
候选 解 为 相对 于 所 有 其 他 邻 域 解 、Pareto 
表 和 候选 表 中 解 都 是 Pareto 最 优 的 邻 域 解 


aa WI 


更 新 各 种 表 : 

Pareto 表 中 所 有 受 控 于 任何 邻 域 解 的 解 
移 除 ;s 加 入 禁忌 表 和 Pareto 表 ; 其 余 候 
选 解 加 入 候选 表 


达到 最 大 代数 ? 
Y 


停止 


图 4.12 多 目标 禁忌 搜索 算法 的 流程 图 


法 性 能 很 重要 。 如 果 变 量 范围 很 宽 而 步 长 很 小 ， 则 搜索 时 间 会 明显 增 
加 。 相 反 ， 如 果 步 长 很 小 ， 则 容易 跳 过 最 优 解 。 实 际 上 ， 这 对 于 单 目标 
的 实 优化 也 是 相似 的 。 

有 一 点 值得 关注 : 当 算 法 收敛 时 ， 会 出 现 邻 域 中 找 不 到 具有 Pareto 
最 优 性 的 候选 解 且 候选 表 也 为 空 的 情况 而 自动 停止 。 因 此 ， 可 以 放心 地 
设置 足够 大 的 迭代 次 数 来 保证 算法 收敛 。 

Baykasoglu 等 提出 MOTS 算法 时 是 应 用 于 离散 多 目标 的 ， 而 后 又 应 
用 于 连续 优化 ， 并 经 函数 测试 ， 取 得 了 比 用 遗传 算法 求解 多 目标 问题 更 
好 的 效果 。 这 种 MOTS 算法 在 国外 已 经 有 一 些 应 用 ， 但 国内 应 用 得 还 比 
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较 少 。 但 是 ， 作 为 一 种 新 颖 高 效 的 解决 多 目标 优化 问题 的 方法 ， 这 个 框 
架 很 可 能 会 得 到 很 好 的 发 展 。 


4.6.3 ”电子 超市 网 站 链接 设计 中 的 应 用 


禁忌 搜索 算法 作为 一 种 不 依赖 于 问题 的 高 效 寻 优 算法 ， 在 工程 实践 
中 已 经 得 到 广泛 的 应 用 。 下 面 给 出 一 两 个 实际 应 用 的 举例 ， 以 加 深 读者 
对 禁忌 搜索 算法 的 理解 。 

1. 电子 超市 网 站 链接 结构 的 优化 问题 

电子 超市 是 BtoC 电子 商务 的 一 种 表现 形式 ， 经 营 电子 超市 的 公司 
主要 通过 网 站 进行 产品 的 宣传 和 交易 。 为 满足 不 断 变 化 的 需求 ， 网 站 需 
要 跟踪 顾客 的 行为 ， 并 适时 调整 网 站 的 链接 结构 ， 才 能 在 竞争 中 保持 有 
利 地 位 。 关 于 网 站 结构 的 设计 已 经 有 一 些 学 者 进行 了 研究 ， 下 面 给 出 一 
个 更 新 和 优化 网 站 结构 的 模型 ， 并 使 用 禁忌 搜索 算法 进行 求解 。 

电子 超市 网 站 中 的 链接 主要 分 为 两 类 ， 反映 商品 目录 结构 的 链接 称 
为 基本 链接 ， 方 便 顾客 浏览 的 链接 称 为 附加 链接 。 如 果 将 网 页 和 链接 分 
别 视 为 顶点 和 弧 ， 则 网 站 结构 可 以 抽象 为 一 个 带 标号 的 有 向 图 。 设 网 站 
中 共有 N 个 网 页 ， 标 号 为 0 ~N -1， 其 中 主页 的 标号 为 0。 定 义 布尔 矩 
PEB=(b,| i, j=0, =, N-1}, Heeb, =1 表示 链接 (i, j) 为 基本 


链接 ，b = 0 表示 其 他 情况 。 定 义 布尔 矩阵 于 = |ar| i, j=0,…， 
N -1| 代表 网 站 的 一 种 链接 结构 ， 其 中 xy =1 代表 链接 G, 7) 存在 ， 
xy =0 代表 链接 (i, j) 不 存在 。 


链接 不 存在 长 短 的 差异 ， 所 以 网 站 结构 图 为 一 个 无 权 图 。 网 页 的 层 
次 定义 为 从 主页 到 达 网 页 经 过 的 最 少 链接 个 数 。 

2. 相关 的 基本 概念 

(1) 链接 的 可 达 性 

链接 的 可 达 性 取决 于 其 所 在 网 页 的 情况 ， 定 义 为 顾客 点 击 链接 的 可 
能 性 。 在 不 对 链接 进行 特殊 处 理 且 不 考虑 顾客 偏好 的 情况 下 ， 某 网 页 上 


各 个 链接 被 点 击 的 可 能 性 是 相同 的 ， 这 样 链接 (i, j) 的 可 达 性 
HOO = h,i j = Oy -1 (4.12) 
(2) 网 页 可 达 性 


网 页 的 可 达 性 定义 为 用 户 沿 所 有 路 径 到 达 此 网 页 的 可 能 性 之 和 。 由 
于 实际 网 站 中 网 页 和 链接 的 数目 众多 ， 计 算 所 有 可 能 的 路 径 几乎 是 不 可 
能 的 ， 这 里 考虑 主要 的 路 径 ， 即 用 户 按照 网 页 层次 由 浅 人 深 的 路 径 ， 这 
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样 的 路 径 一 定 包 含 了 由 主页 到 达 页 面 的 最 短路 径 。 为 得 到 这 样 定义 的 到 

达 每 个 网 页 的 所 有 路 径 ， 可 以 使 用 路 径 树 生成 算法 生成 路 径 树 。 
根据 得 到 的 路 径 树 ， 可 以 计算 下 列 物理 量 : 

N, 2f (X) ,iz1,-,N-1 (4.13) 

Ly =gy(X) ,iz1,--,N - 11 21,---,N, (4.14) 

Jy 5 h4(X) 4i813,,N -14l 81, , Nj 3, (Ly 1) (4.15) 

Ep, N 为 用 户 可 以 到 达 网 页 i 的 路 径 条 数 ; Li 为 到 达 网 页 i 的 第 1 条 

路 径 所 需 的 步 数 ; J 为 到 达 网 页 i 的 第 1 条 路 径 的 第 j 个 网 页 的 标号 。 

于 是 网 页 i 的 可 达 性 计算 公式 为 


No ta 
P(X) = » I] Hygga (X) i = 1, N -1 (4.16) 
假设 顾客 都 是 首先 到 达 网 站 主页 ， 因 此 不 定义 主页 的 可 达 性 。 
(3) 平均 载 人 时 间 
设 ri(i=0,，…，N-1) 为 网 页 i 的 平均 下 载 时 间 ， 它 与 网 页 大 小 
和 网 络 的 平均 传输 速度 有 关 。 网 页 i 的 平均 载 人 时 间 了 ,与 到 达 此 网 页 的 
路 径 条 数 和 路 径 上 所 有 网 页 的 载 人 时 间 有 关 ， 计 算 公 式 为 


Ni hgst 


T(X)- xA Y onuizbesN-1 (4.17) 


(4) 网 页 访问 率 
根据 网 络 服务 器 在 过 去 一 段 时 间 内 统计 的 每 一 网 页 被 访问 的 次 数 ， 
可 以 按 式 (4.18) 计算 网 页 访问 率 


Q =i ely Nl (4.18) 


其 中 ，0, 为 网 页 i 的 访问 率 ; Void 2:— BUS A FOX i cU Il f CCS 

3. 数学 模型 

(1) 模型 的 建立 

按照 方便 顾客 的 原则 ， 访 问 率 高 的 网 页 应 该 具有 较 大 的 可 达 性 和 较 
小 的 载 人 时 间 ， 这 里 采用 相关 性 来 度量 两 组 量 U,V.(i=1, =, N-1) 
的 相关 程度 : 


Y (UD -v 
LED = (4.19) 
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能 太 多 ， 同 时 ， 应 该 避免 新 增加 的 链接 过 多 地 集中 于 某 些 网 页 ， 或 者 减 
少 链接 时 将 指向 某 些 网 页 的 链接 过 多 地 删除 。 另 外 ， 新 增加 的 链接 在 内 
容 上 应 该 具有 相关 性 。 于 是 建立 如 下 多 目标 数学 模型 : 


max f (X) = Cov( Q., P.C ) (4.20) 
max f, (X) = Cos Q,, CT, 0 ) 7) (4.21) 
ex lzy -a| € Ri 20,5, N -1 (4.22) 
5 le; al < C£ = 0, N 21 (4.23) 


x,-b,z0,i,j20,-, N-1 (4.24) 
u,-x,20,ij7 SN -1 (4.25) 

Jtr, Xx (4.20) 表示 最 大 化 网 页 可 达 性 与 网 页 访问 率 的 相关 性 ， 网 
页 访问 率 0, 为 常数 ， 调 整 后 网 站 链接 结构 X 为 决策 变量 ; 式 (4.21) 
表示 最 大 化 网 页 载 人 时 间 的 倒数 与 网 页 访问 率 的 相关 性 ; 式 (4.22) 
表示 增加 或 减少 指向 某 个 网 页 的 链接 的 个 数 约束 ， 常 数 a 为 网 站 的 当 
前 链接 结构 ，R, 为 常数 ; 式 (4.23) 表示 某 网 页 上 增加 或 减少 的 链接 
个 数 约束 ，C; 为 常数 ; R (4.24) 表示 基本 链接 不 可 以 删除 ， 常 数 5, 
表示 基本 链接 情况 ; 式 (4.25) 表示 增加 的 链接 内 容 上 应 该 具有 相关 
性 ， 常 数 w = 1 表示 网 页 M/ARLMK, uy =0 表示 网 页 i 和 j 内 容 
上 不 相关 。 

(2) 转化 为 单 目标 问题 

设 多 目标 问题 式 (4.20) ~ (4.25) B6 ERE OS. CA, f), 并 设 
E(X) 为 式 (4.22) ~ (4. 25 ) 构 成 的 可 行 域 。 采 用 处 理 多 目标 问题 的 极 大 
模 理 想 点 法 ， 上 述 问题 可 以 转化 为 单 目标 问题 : 


min A (4. 26) 
s.t. Xe E(X) (4.27) 
fi -f(X)<a (4.28) 

万 -f (X)<A (4.29) 

Azo (4.30) 


根据 极 大 模 法 相关 定理 ， 问 题 式 (4. 26) ~ (4. 30) 的 最 优 解 为 原 问 
题 式 (4. 20) ~ (4.25) 的 弱 有 效 解 。 于 是 ， 求 解 原 多 目标 问题 变 为 求解 
其 理想 点 和 新 的 单 目标 问题 。 

4. 求解 算法 

网 站 链接 结构 优化 问题 的 模型 中 ， 要 用 到 路 径 树 生成 算法 ， 使 得 
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网 页 的 可 达 性 和 载 人 时 间 无 法 用 解析 形式 来 表达 ， 故 难以 用 传统 的 优 
化 方法 求解 。 这 里 使 用 禁忌 搜索 算法 来 求解 原 多 目标 问题 的 理想 点 以 
及 转化 后 的 单 目标 问题 。 求 解 过 程 中 的 相关 环节 比较 相似 ， 集 中 说 明 
如 下 。 

(1) 编码 方式 : 决策 变量 为 0-1 变量， 所 以 直接 采用 0-1 编码 
方式 。 

(2) 初始 解 : 算法 的 初始 解 取 网 站 的 当前 链接 结构 ， 即 于 =4 = 
|as| 。 容 易 知 道 ， 这 样 的 初始 解 是 可 行 的 。 

(3) 邻 域 结构 : 任意 改变 当前 解 中 的 一 个 元 素 的 值 形成 的 解构 
成 当前 解 的 邻 域 ， 只 保留 满足 约束 条 件 的 邻 域 解 ， 即 可 行 邻 域 解 。 

(4) BER: 以 发 生 改 变 的 元 素 〈(i, j) ， 即 增加 或 删除 的 链接 为 
禁忌 对 象 ， 禁 忌 长 度 取 常数 7。 此 外 ， 引 入 中 期 表 来 记录 修改 增加 或 
删除 ) 链接 Ci, D) 的 频数 ， 并 施加 频数 惩罚 , FOX) =f(X) -w- 
penalty(i, j) o 

(5) 渴望 水 平 ， 当 优 于 历史 最 优 解 时 ， 就 认为 达到 了 渴望 水 平 。 

(6) 停止 准则 : 设置 最 大 迭代 次 数 为 停止 准则 。 

当然 ， 完 全 可 以 使 用 本 章 介绍 的 多 目标 禁忌 搜索 MOTS 算法 直接 求 
解 这 个 多 目标 问题 。 只 是 为 了 说 明 简 单 的 禁忌 搜索 算法 就 能 很 好 地 求解 
如 此 复杂 的 优化 问题 。 传 统 的 优化 方法 只 能 求解 特定 类 型 的 问题 ， 例 如 
线性 的 、 二 次 的 等 ; 而 禁忌 搜索 算法 能 求解 的 问题 没有 这 样 的 限制 ， 其 
中 变量 甚至 可 以 不 是 解析 的 ， 只 要 能 用 程序 得 到 变量 的 取 值 就 可 以 了 ， 
充分 显示 出 禁忌 搜索 算法 极 大 的 灵活 性 。 

5. 计算 举例 

图 4. 13 所 示 为 一 个 网 站 的 基本 链接 结构 ， 附 加 链接 见 表 4. 1， 在 
过 去 一 段 时 间 内 每 个 网 页 的 访问 次 数 见 表 4. 2， 平 均 加 载 时 间 见 表 4.3。 
表 4.4 中 给 出 了 矩阵 U 中 为 0 的 元 素 集合 ， 即 不 相关 网 页 对 。 

0 


26 27 28 29 30 31 32 33 34 


图 4.13 网 站 的 基本 链接 结构 
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用 Java 语言 实现 了 以 上 算法 ， 在 每 个 网 页 上 最 多 增 、 碱 两 个 链接 
(R,=C,=2, i=0, 1, =, N-1) 的 情况 下 进行 了 仿真 实验 ， 得 到 的 
仿真 结果 见 表 4. 5。 结 构 调整 后 目标 函数 值 f 由 0. 381 增加 到 0.736, 
万 由 0.251 增加 到 0. 672， 改 进 效果 明显 。 

表 4.1 优化 前 网 站 的 附加 链接 
(0,4) (0,18) (0,23) (0,26) (2,6) (2,17) (8,16) (9,14) (15,27) (17,30) 
(20,31) (21,34) (23,30) (25,26) (26,0) (26,3) (27,1) (27,3) (28,1) (28,4) 
(29,3) (30,0) (30,5) (31,5) (31,7) (32,5) (32,7) (32,8) (33,9) (34,6) 


表 4.2 网 页 的 访问 次 数 
" 0 1 2 3 4 5 6 7 8 9 


表 4.3 网 页 的 平均 加 载 时间 
Ts 0 1 2 3 4 5 6 7 8 9 
— [5.28 3.64 0.26 6.20 1.50 9.94 2.76 5.44 0.88 8.56 


104 1.24 16.04 4.14 0.78 0.74 0.78 7.26 0.88 27.64 0.54 
20+ 1.44 0.90 2.62 3.88 2.54 2.50 2.92 2.96 1.56 1.66 
30+ 2.18 2.90 1.72 3.20 2.14 


对 应 于 弱 有 效 解 ， 网 页 可 达 性 和 载 人 时 间 的 倒数 和 网 页 访问 率 的 对 
应 关系 分 别 如 图 4. 14 和 图 4. 15 所 示 。 


"eoo. 
0.01 
Ol a | Rare 
13 5 7 9 1 13 15 17 19 21 23 25 27 29 31 33 
网 页 的 序号 


图 4.14 网 页 可 达 性 与 访问 率 的 对 应 关系 (cov =0.736) 
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访问 率 
A RARITA) 


1 3 5 7 9 m 13 15 17 19 21 23 25 27 29 31 33 
网 页 的 序号 
图 4.15 网 页 载 人 时 间 的 倒数 与 访问 率 的 对 应 关系 (cov = 0. 672) 
优化 前 后 附加 链接 的 变化 情况 见 表 4. 6 UR, JO te" otn 
分 别 表示 增加 和 减少 的 链接 。 


表 4.4 不 相关 网 页 对 
— 


源 网 页 目标 网 页 源 网 页 目标 网 页 
1 — 2,3,7,18,20,22,24,25,29,30,33 || 16 17,28,30 
2 3,5,6,9,11,14,15,21,26,27,31,92|. 17 18,19,21,24,26,29,34 
3 4,6,7,13,17,18,19,28,30 18 20,23,28,31 
4 5,7,9,13,16,18,20,23,30,31,32,34|] 19 23,30,32 
5 7,10,11,17,23,29,32,33 20 22 ,23 ,24 ,26 ,29 ,31 
6 7,8,12,18,21,30,32 21 24,29,32 
7 9,11,15,17,21,29,30,33 22 26,33,34 
8 11,13,21,22,23,25,27 23 27 
9 17,19,23,26,29,30,31,33,34. || 24 25,26,29 
10 15,20,22,28,29,31,32 25 29,30,33 
n 14,19,29,30 26 29,33,34 
12 14,17,19,28 27 30,32,34 
13 16,27 28 29,30,31,32 
14 15,32 29 33,34 
15 26,29,32 30 31,33,34 


R45 理想 点 和 弱 有 效 解 


初始 解 理想 点 BARR 与 理想 点 之 差 
4G) 0.381 0. 796 0. 736 0. 061 
4G) 0.251 0.757 0.672 0.085* 


注 :“* ”转化 后 单 目标 问题 的 最 优 解 。 
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以 上 算法 的 平均 运行 时 间 为 88. 4 s， 这 在 中 、 小 型 网 站 的 优化 中 是 
可 以 接受 的 。 考 虑 到 Java 的 运行 效率 较 低 ， 而 且 网 站 的 链接 结构 可 以 
使 用 邻接 表 来 存储 ， 尚 有 提高 算法 运行 效率 的 余地 。 
表 4.6 优化 前 后 附加 链接 的 变化 情况 
+(0,30) +(1,34) +(2,13) +(3,8) +(3,21) +(5,8) +(6,1) +(6,24) +(7,12) 
+(7,32) +(8,0) +(8,1) +(10,9) +(10,33) +(11,17) +(11,28) +(12,2) +(12,3) 
+(13,25) +(16,5) +(16,6) +(17,4) +(17,6) +(18,29) +(20,5) +(20,7) +(21,4) 
+(21,9) +(22,29) + (23,21) +(24,7) + (24,10) (25,11) + (25,13) + (26,12) + (26,31) 
+ (27,11) + (27,14) + (28,15) + (28,19) + (29,16) + (29,18) + (30,15) + (31,23) + (31,26) 
+ (32,23) + (32,26) + (33,19) + (33,24) + (34,31) + (34,32) - (0,18) -(2,17) - (9,14) 
-(23,30) - (30,0) 


4.604 多 盘 刹 车 设计 中 的 应 用 


1. 问题 的 描述 

关于 多 盘 和 刹车 设计 问题 的 详细 描述 参见 本 章 参考 文献 [11] 。 这 里 
直接 给 出 如 下 多 目标 优化 模型 : 

min f, (x) =4.9x10 (xj! - x^) (x, -1) 
min f(x) 2222 X10 (n m ee ) 

min f(x) = xs 
$&tx,-z,-2020 
30 -2.5(x, +1) 20 


x 


0.4 7x20 


3 
73.14(x,! -x,!) 
i 2.22 x10? x, (x,! x) 
ue Po a 
2.66 x10 ^ x,x (x) x?) 
TH rage 

55<x, «80 

75&x,«110 
1 000 <x, <3 000 

2<x,<20 
模型 中 包括 4 TRA, Hex, x, Ax, 3 个 为 连续 型 ，x 为 离散 
型 ; 3 个 目标 函数 ， 包 括 线性 的 和 非 线性 的 〈 高 次 ) ; 除 变量 取 值 范围 


z0 


-900z0 
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之 外 ,包括 5 个 约束 条 件 ， 其 中 包括 高 次 的 ， 这 是 一 个 混合 多 目标 规划 
模型 。 

2. MOTS 参数 设置 及 运行 环境 

Baykasoglu (2005) 使 用 4.6.2 节 中 介绍 的 多 目标 禁忌 搜索 MOTS 
算法 对 该 多 目标 模型 进行 求解 ， 参 数 设置 如 下 。 

DORRA: 20。 

回 邻 域 移动 策略 : 简单 策略 。 

@QRERKE: 20. 

图 连续 型 变量 步 长 : 0.01. 

OM HE MEK: 1。 

ORKERL RM: 20 000, 

MOTS 算法 使 用 C ++ 语言 实现 ， 运 行 环境 为 Pentium NAAA 
机 ，CPU: 1.60 Hz， 内存 : 256 MB。 

3. MOTS 算法 计算 结果 

按 以 上 配置 参数 和 运行 环境 ，MOTS 算法 运行 了 大 约 10 min， 求 得 
5 964 个 Pareto 最 优 解 。 在 此 之 前 ，Osyczka 和 Kundu 也 求解 了 这 个 模 
型 ， 使 用 简单 随机 搜索 (Plain Stochastic) 得 到 了 19 个 Pareto 最 优 解 ， 
使 用 遗传 算法 迭代 20 000 次 得 到 了 133 个 最 优 解 。 可 见 ， 相 对 于 简单 
随机 搜索 和 遗传 算法 ，MOTS 算法 得 到 了 相当 多 的 高 质量 Pareto 最 
AUR o 

同时 ， 使 用 这 三 种 方法 求 得 的 极限 (Extreme) 点 ， 即 单一 目标 函 
数 的 最 优 值 ， 列 出 如 表 4.7 所 示 ， 其 中 加 粗 部 分 对 应 得 到 优化 的 目标 函 
数 分 量 。 可 以 看 到 ， 大 部 分 情况 下 ，MOTS 算法 的 结果 比 其 他 两 种 方法 
好 得 多 ， 只 是 min 户 (*) 对 应 情况 稍 差 一 点 点 。 

表 4.7 各 方法 求 得 极限 点 比较 


求解 方法 目标 函数 F(X) = [所 (zx) ,万 (z) 0017 
min f, (x) (1.79, 2.77, 2920.9] 
一 般 随 机 min f, (x) [3.76, 2.24, 2 948.4] 
iria min f, (x) [3.25, 2.80, 2 309.2] 
mif) | [1.66, 2.87, 2982.4] 
遗传 算法 min f, (x) [3.25, 2.11, 2 988.3] 
min f, (x) [3.91, 2.86, 2255.1] 
min f, (x) [0.131 156, 41.353 2, 1 183.29] 
MOTS 算 法 | min f(x) [2. 166 56, 2.15, 2 981.64] 
min f, (x) [1.153 09, 10. 850 8, 1 000.03] 
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本 节 给 出 了 两 个 禁 鼠 搜索 算法 的 应 用 实例 ，4. 6. 3 节 的 实例 应 用 的 
是 基本 禁忌 搜索 算法 ， 成 功 地 求解 了 模型 中 有 些 变量 不 能 解析 化 的 模 
型 ， 充 分 体现 出 禁忌 搜索 算法 相对 于 传统 算法 的 优越 性 。4. 6. 4 节 的 实 
例 为 扩展 后 的 应 用 于 多 目标 的 禁忌 搜索 MOTS 算法 ， 模 型 中 包括 连续 变 
量 和 离散 变量 ， 目 标 函 数 与 约束 都 是 非 线 性 的 ， 搜 索 到 的 结果 从 各 方面 
优越 于 文献 中 的 其 他 方法 。 体 现 出 禁忌 搜索 算法 不 但 能 求解 单 目标 的 组 
合 优化 ， 而 且 完 全 能 求解 连续 的 、 多 目标 的 优化 问题 。 


问题 与 思考 


1. 对 于 背包 问题 : 7 件 财宝 的 价值 为 ,和 质量 为 vw，(i=1,…, 7) 某 人 能 背 
动 的 质量 为 120。 设 x, =1 表示 选择 财宝 i，x, =0 表示 不 选择 财宝 i。 试 用 禁忌 搜索 
算法 求 出 最 好 解 。 初 始 解 = [1010101] ， 邻 域 搜索 选 为 加 1 减 1 运算 ， 做 5 Kw 
R, 禁忌 长 度 取 3 (只 用 短期 表 ) 。 

2. 某 公司 拟 在 4 个 地 点 建 4 个 工厂 。4 个 工厂 的 设计 占 地 面积 分 别 为 R, =9， 
R, =8, R, =4，R, =5; 4 个 地 点 的 地 价 分 别 为 P =3，P =2，P, =4，P, = 1。 公 
司 的 可 用 资金 量 为 70。 设 状态 下 = [n, n, m, xn], x = 上 表示 工厂 i 选 在 地 点 
k, MANOS X= [1 3 24] ， 用 基本 禁忌 搜索 作 3 KER, RAM, REKE 
取 3 (只 用 短期 表 ) 。 

3. 旅行 商 问题 可 简 述 如 下 : 找 一 条 经 过 n 个 城市 的 巡回 (每 个 城市 过 且 只 过 
一 次 ) ， 极 小 化 总 上 路程。 其中， 城市 i、j 间 的 距离 用 ds, 表示 。 设 计 用 禁忌 搜索 算法 
求解 该 问题 的 算法 。 要 求 写 明 编码 方式 、 邻 域 选择 策略 、 禁 忌 对 象 、 渴 望 水 平 以 及 
停止 准则 ， 并 给 出 流程 图 。 

4. 工作 指派 问题 简 述 如 下 : n 个 工作 可 以 由 个 工人 分 别 完 成 。 工 人 i 完成 工 
作 j 的 时 间 为 由 。 问 如 何 安排 可 使 总 工作 时 间 达 到 极 小 ? 试 建立 数学 模型 ， 并 按 禁 
鼠 搜 索 设 计 求解 问题 的 算法 〈 包 括 编码 方式 ， 邻 域 选 择 策略 、 禁 鼠 对 象 、 渴 望 水 
平 、 停 止 准则 ) ， 并 画 出 程序 流程 图 。 

5. 禁忌 搜索 算法 与 传统 优化 算法 的 最 主要 区 别 是 什么 ? 

6. 禁忌 搜索 算法 与 其 他 智能 优化 算法 的 最 主要 区 别 是 什么 ? 

7. 以 旅行 商 问题 为 例 ， 编 写 程序 实现 禁忌 搜索 算法 ， 并 体会 禁忌 表 长 度 对 算 
法 性 能 的 影响 。 你 认为 禁忌 长 度 应 该 如 何 设置 ? 
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$53 模拟 退火 算法 


模拟 退火 (Simulated Annealing, SA) 算法 是 一 种 通用 的 随机 搜索 
算法 ， 是 对 局 部 搜索 算法 的 扩展 。 与 一 般 局 部 搜索 算法 不 同 ，SA 以 一 
定 的 概率 选择 邻 域 中 目标 值 相对 较 小 的 状态 ， 是 一 种 理论 上 的 全 局 最 优 
算法 。 模 拟 退火 算法 是 源 于 对 热力 学 中 退火 过 程 的 模拟 ， 在 某 一 给 定 初 
温 下 ， 通 过 缓慢 下 降温 度 参数 ， 使 算法 能 够 在 多 项 式 时 间 内 给 出 一 个 近 
似 最 优 解 。 虽 然 早 在 1953 年 ，Metropolis 就 提出 了 模拟 退火 算法 的 思 
想 ， 但 直到 1983 年 Kirkpatrick 成 功 地 将 SA 应 用 在 组 合 最 优化 问题 
中 ， 才 真正 创建 了 现代 的 模拟 退火 算法 。 本 章 将 对 模拟 退化 算法 的 基本 
思想 、 算 法 的 构造 、 实 现 技术 、 收 敛 性 分 析 以 及 实际 应 用 一 一 介绍 。 


5.1 导 a 


‘ATE 1953 4E, Metropolis 等 人 就 提出 了 原始 的 SA 算法 ， 但 是 并 没 
有 引起 反响 ， 直 到 1983 年 Kirkpatrick 等 人 提出 了 现代 的 SA 算法 ,并 
成 功 地 利用 它 来 解决 大 规模 的 组 合 最 优化 问题 。 由 于 现代 SA 算法 能 够 
有 效 地 解决 具有 NP 复杂 性 的 问题 ， 避 免 陷 入 局 优 ， 克 服 初 值 依赖 性 等 
优点 ， 目 前 已 在 工程 中 得 到 了 广泛 的 应 用 ， 诸 如 VLS、 生 产 调度 、 控 制 
工程 、 机 器 学 习 、 神 经 网 络 、 图 像 处 理 等 领域 。 模 拟 退 火 算法 的 基本 思 
想 是 源 于 热力 学 中 的 退火 过 程 ， 因 此 首先 介绍 一 下 热力 学 当中 的 退火 
过 程 。 


5.1.1. 热力 学 中 的 退火 过 程 


金属 物体 被 加 热 到 一 定 温度 后 ， 它 的 所 有 分 子 在 状态 空间 自由 运动 ， 
随 着 温度 的 逐渐 下 降 ， 分 子 停留 在 不 同 的 状态 ， 分 子 运 动 逐渐 趋 于 有 序 ， 
最 后 以 一 定 的 结构 排列 。 这 种 由 高 温 向 低温 逐渐 降温 的 热处理 过 程 就 称 
为 退火 。 退 火 是 一 种 物理 过 程 ， 在 退火 过 程 中 系统 的 焙 值 不 断 减 小 ， 
系统 能 量 随 温度 的 降低 趋 于 最 小 值 ， 也 就 是 说 ， 金 属 物体 从 高 能 状态 
转移 到 低能 状态 ， 变 得 较为 柔韧 。 一 个 退火 过 程 一 般 由 以 下 三 部 分 组 成 。 

1. 加 温 过 程 

其 目的 是 增强 分 子 的 热 运 动 ， 使 其 偏离 平衡 位 置 。 当 温度 足够 高 
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时 ， 固 体 将 溶解 为 液体 ， 分 子 的 分 布 从 有 序 的 结晶 态 转变 成 无 序 的 液 
态 ， 从 而 消除 系统 原先 可 能 存在 的 非 均 匀 态 ， 使 随后 进行 的 冷却 过 程 以 
某 一 平衡 态 为 起 点 。 溶 解 过 程 与 系统 的 焙 增 过 程 相 联系 ， 系 统 能 量 也 随 
温度 的 升 高 而 增 大 。 

2. 等 温 过 程 

这 个 过 程 是 为 了 保证 系统 在 每 一 个 温度 下 都 达到 平衡 态 ， 最 终 达 到 
固体 的 基态 。 根 据 热平衡 封闭 系统 的 热力 学 定律 一 自由 能 减少 定律 : 
“对 于 与 周围 环境 交换 热量 而 温度 不 变 的 封闭 系统 ， 系 统 状态 的 自发 变 
化 总 是 朝 自由 能 减少 的 方向 进行 ， 当 自由 能 达到 最 小 时 ， 系 统 就 达到 了 
平衡 态 。” 

3. 冷却 过 程 

其 目的 是 使 分 子 的 热 运动 减弱 并 渐 趋 有 序 ， 系 统 能 量 逐 渐 下 降 ， 当 
温度 降 至 结晶 温度 后 ， 分 子 运动 变 成 了 围绕 晶体 格 点 的 微小 振动 ， 液 体 
凝固 成 固体 的 晶 态 ， 从 而 得 到 低能 的 晶体 结构 。 

金属 物体 被 加 热 到 一 定 温度 后 ， 若 急剧 降低 温度 ， 则 物体 只 能 冷凝 
为 非 均 匀 的 亚 稳 态 ， 这 就 是 热处理 过 程 中 的 淳 火 效 应 。 淳 火 也 是 一 种 物 
理 过 程 ， 由 于 物体 在 这 个 过 程 中 并 没有 达到 平衡 态 ， 所 以 系统 能 量 并 不 
会 达到 最 小 值 ， 也 就 是 说 ,金属 依然 保持 在 高 能 状态 ， 虽然 能 提高 其 强 
度 和 硬度 ， 但 韧性 会 减弱 。 


退火 NX 


缓慢 下 降 快速 下 降 


金属 高温 
高 能 状态 


低温 金属 高 温 
低能 状态 高 能 状态 


低温 、 
低能 状态 


图 5.1 BASH ARE 
5.1.2. 退火 与 模拟 退火 


金属 物体 的 退火 过 程 实际 上 就 是 随 温度 的 缓慢 降低 ， 金 属 由 高 能 无 
序 的 状态 转变 为 低能 有 序 的 固体 唱 态 的 过 程 。 在 退火 中 ， 需 要 保证 系统 
在 每 一 个 恒定 温度 下 都 要 达到 充分 的 热平衡 ， 这 个 过 程 可 以 用 Monte 
Carlo 的 方法 加 以 模拟 ， 该 方法 虽然 比较 简单 ， 但 需要 大 量 采 样 才能 获 
得 比较 精确 的 结果 ， 计 算 量 较 大 。 鉴 于 物理 系统 倾向 于 能 量 较 低 的 状 
态 ， 而 热 运动 又 妨碍 它 准确 落 到 最 低 态 的 物理 形态 ， 采 样 时 只 需 着 重 取 
那些 有 贡献 作用 的 状态 则 可 较 快 达到 较 好 的 结果 。1953 年 ，Metropolis 


138 第 5 章 模拟 退火 算法 


等 提出 了 一 种 重要 性 采样 法 ， 即 以 概率 来 接受 新 状态 。 具 体 而 言 ， 在 温 
度 :， 由 当前 状态 i 产生 新 状态 j， 两 者 的 能 量 分 别 为 E, 和 E, # 
E,>E,， 则 接受 新 状态 j 为 当前 状态 ; 否则 ， 以 一 定 的 概率 p, = 


exp FL pc sj, QU k Bolizmann 常数 。 这 里 ，exp 
[x] 即 为 指数 函数 e* 。 当 这 种 过 程 多 次 重复 ， 即 经 过 大 量 迁 移 后 ， 系 
统 将 趋 于 能 量 较 低 的 平衡 态 ， 各 状态 的 概率 分 布 将 趋 于 一 定 的 正则 分 
布 。 这 种 接受 新 状态 的 方法 被 称 为 Metropolis 准则 ， 它 能 够 大 大 减少 采 
样 的 计算 量 。 

对 于 一 个 典型 的 组 合 优化 问题 ， 其 目标 是 寻找 一 个 *" ， 使 得 对 于 
Vx,eQ, E clx’) =min c(x,)， 其 中 全 = x,，x，,，…，%*,| 为 由 所 
有 解构 成 的 解 空间 ，c(x,) Ja WR x, 对 应 的 目标 函数 值 。 利 用 简单 的 仆 山 
算法 来 求解 这 类 优化 问题 时 ， 在 搜索 过 程 中 很 容易 陷 人 局 优点 ， 具 有 相 
当 的 初 值 依赖 性 。Kirkpatrick 等 人 根据 金属 物体 的 退火 过 程 与 组 合 优化 
问题 之 间 存在 的 相似 性 ， 并 且 在 优化 过 程 中 采用 Metropolis 准则 作为 搜 
索 策略 ， 以 避免 陷入 局 部 最 优 ， 并 最 终 趋 于 问题 的 全 局 最 优 解 。 

在 SA 中 ， 优 化 问题 中 的 一 个 解 x, 及 其 目标 函数 e (n). 分 别 可 以 看 
成 物理 退火 中 物体 的 一 个 状态 和 能 量 西数 ， 而 最 优 解 ** 就 是 最 低能 量 
的 状态 。 而 设 定 一 个 初始 高 温 、 基 于 Metropolis 准则 的 搜索 和 控制 温度 
参数 4 的 下 降 分 别 相当 于 物理 退火 的 加 温 、 等 温和 冷却 过 程 。 表 5.1 就 
描述 了 一 个 组 合 优化 问题 的 求解 过 程 与 物理 退火 过 程 之 间 的 对 应 关系 。 


表 5.1 组 合 优化 问题 的 求解 与 物理 退火 
T—— 


优化 问题 物理 退火 
解 状态 
目标 函数 能 量 函数 

最 优 解 最 低能 量 的 状态 
设 定 初始 高 温 加 温 过 程 
基于 Metropolis 准则 的 搜索 等 温 过 程 
温度 参数 :的 下 降 冷却 过 程 


5.2 退火 过 程 的 数学 描述 和 Boltzmann 方程 


前 节 指出 ， 退 火 过 程 是 一 个 变温 物体 缓慢 降温 从 而 达到 分 子 间 能 量 
最 低 状态 的 过 程 。 设 热力 学 系统 5 中 有 个 状态 ,注意 这 里 的 状态 数 是 
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有 限 且 离散 的 ， 其 中 状态 i 的 能 量 为 E;。 在 温度 7, 下， 经 一 段 时 间 达 到 
热平衡 ， 这 时 处 于 状态 i 的 概率 为 


PO) -Gev( T) (5.1) 


式 中 ，C 是 一 个 参数 ， 能 够 根据 已 知 条 件 计算 获得 。 由 于 S 中 一 共存 在 
n 个 状态 ， 故 在 温度 Ti 下 ，3 必然 处 于 其 中 的 一 个 状态 ， 也 就 是 说 


x P(T,) 21 (5.2) 
RAR (5.1), W 


-E -E, 
» Ge) 2126, Y (z) =1 


fa 


由 此 得 到 待定 系数 
1 
6,5 
DE 
X e» 
FE, XX (5.1) 可 以 表示 为 
| 
P.(7,) -———- (5.3) 
A) 


根据 式 (5.1) ， 对 于 任意 两 个 能 量 状态 E, 和 E,， 若 存在 E, <E, 
则 在 同一 个 温度 7, 下， 有 
-E, 
Cexw( T 


PAT) _ 
PT) 


Corp( 
WX E,-E, 20, 有 


E, - E, 
exp( - +) <1, YT,>0 
A 


所 以 必 有 
P,(T,) »P(T,), VT, >0 (5.4) 
这 表明 在 同一 温度 下 ， 式 (5.4) 表示 S 处 于 能 量 小 的 状态 的 概率 
比 处 于 能 量 大 的 状态 的 概率 要 大 ， 也 就 是 说 ， 在 同一 温度 下 ， 随 着 状态 
能 量 函 数 的 减 小 ， 其 概率 将 会 增 大 ， 两 者 之 间 存 在 着 反 向 变化 的 关系 。 
R (5.1) MR (5.3) 又 称 为 Boltzmann 方程 ， 用 于 描述 系统 S 在 
给 定 温度 下 ， 处 于 某 一 状态 的 概率 分 布 。 根 据 Boltzmann 方程 来 分 析 状 
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态 概率 随 温度 变化 的 规律 。 对 P(T) 求 对 温度 的 导数 ， 得 到 


CAE [m/z oF) 
9T, : a à T, 


wE " 
- Rope o P? (E, - E) ex ( 7, )] (5.5) 


n [3 (2))] 
设 让 为 5 中 最 低能 量 的 状态 ， 则 Vj， FEE. -E<0, T 


-E, 
>> O,exp( 7, ) >0 


故 有 


(5.6) 


接着 ,分 两 种 情况 来 讨论 当 7,0 时 ， 如 何 计算 P. (T) o 
(1) 当 S 中 仅 存在 一 个 最 低能 量 状态 记 时， 也 就 是 说 ， 在 解 空间 
中 存在 唯一 的 全 局 最 优 解 时 ， 则 当 TOY, FVA, FE 
- (E, -E,.) - (E, -E,.)] _ 
E, -E >05 =t IU -0 


所 以 


= = © exp | 
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EE =1 (5.7) 


(2) MS PEE m 个 最 低能 量 状 态 时 ， 假 设 i 是 其 中 的 一 个 状 
态 ， 这 相当 于 ， 在 解 空间 中 存在 若干 个 全 局 最 优 解 。 根 据 上 面 的 推导 ， 
能 够 获得 ， 当 7,0 时 

PT) = 一 -一 一 二 一 一 一 = 二 (5.8) 


B "E ce 22] n, 


DR, E T,—0 时 ，S 处 于 站 状态 的 概率 是 1/n。。 由 于 5 中 存在 m 
个 最 低能 量 状态 ， 所 以 ， 当 T0 时 ，S 处 于 最 低能 量 状 态 的 概率 赵 
向 1。 

因此 ,根据 式 (5.7) 和 式 (5.8) WIR, S T,0 时 S 处 于 最 低 
能 量 状态 的 概率 趋向 于 1。 

MECT) 来 表示 温度 7, 下 的 平均 能 量 ， 则 


E(n) = Y E PICO 
由 式 (5.7) 和 式 (5.8), Bn" 7,0 Hf, E(T,) >E; o 
根据 式 (5.1) WA, METAK, 190, stm PCT) eL 
也 就 是 说 ， 当 温度 很 高 时 ，S 处 于 各 状态 的 概率 几乎 相等 。SA 开始 做 
广 域 的 随机 搜索 ， 随 着 温度 的 下 降 ， 状 态 概率 P,(7,) 的 差别 开始 扩 
X, M T,90 时 ， i4. 此 时 E, 5 E, 2c M BO BIN E SU SB n 
A 
P(CT,) A P,(7,) 的 剧烈 变化 。 
例如 : 假设 E,=90，E, =100， 当 温度 T, = 100 时 
PA(T,) C, -e 0.406€, 0.406 _ 
P(T,) c,..- 0.3670, 0.367 
wat, PCT.) e PCT o 
当 温 度 T, =1 时 
PAT) ce- 


1 


» 
* 8.194x10"C, 20:000 
= = 
P(T) ce- 旦 3.72 x10 “C, 
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此 时 ,Pi(Ti) +P;(T,) e P.CT) o 

在 上 面 的 小 例子 中 ， 当 温度 SET 100 时 ，S 处 于 低能 状态 E, 和 处 
于 高 能 状态 6 的 概率 几乎 相等 ; 而 当 温度 7, 减 小 到 1 的 时 候 ，5 处 于 低 
能 状态 E, 的 概率 比 处 于 高 能 状态 ,的 概率 大 约 高 20 000 倍 。 由 此 可 以 
看 出 ， 在 高 温 下 ，5 可 以 处 于 任何 能 量 状态 ， 此 时 SA 可 以 看 成 是 在 进 
行 广 域 搜索 ， 以 避免 陷 人 局 优 ; 在 低温 下 ，S 只 能 处 于 能 量 较 小 的 状 
态 ， 此 时 SA 可 以 看 成 是 在 做 局 域 搜索 ， 以 便于 将 解 精细 化 ; 当 温度 无 
限 趋 近 于 零 时 ，5 只 能 处 于 最 小 能 量 的 状态 ， 此 时 SA 就 获得 了 全 局 最 
优 解 ， 同 时 这 个 小 例子 也 进一步 验证 了 当 7,50 时 ，5 会 以 概率 1 趋 于 
最 低能 量 状态 。 


5.3 模拟 退火 算法 的 构造 及 流程 


SA 算法 是 一 种 启发 式 的 随机 寻 优 算法 ， 它 模拟 了 物理 退火 过 程 ， 
由 一 个 给 定 的 初始 高 温 开始 ， 利 用 具有 概率 突 跳 特 性 的 Metropolis 抽样 
策略 在 解 空 间 中 随机 进行 搜索 ， 伴 随 温度 的 不 断 下 降 重 复 抽样 过 程 ， 最 
终 得 到 问题 的 全 局 最 优 解 ， 这 就 是 SA 算法 的 基本 思想 。 


5.3.1 算法 的 要 素 构 成 


在 SA 算法 执行 过 程 中 ， 算 法 的 效果 取决 于 一 组 控制 参数 的 选择 ， 
关键 技术 的 设计 对 算法 性 能 影响 很 大 。 本 节 从 算法 使 用 的 角度 讨论 算法 
实现 中 的 一 些 要 素 ， 包括 状 态 表达 ， 邻 域 定义 ,热平衡 达到 和 降温 控制 
等 的 概念 。 

1. 状态 表达 

同 前 面 几 章 介绍 的 遗传 算法 (GA) 和 禁忌 搜索 (TS) 中 的 编码 含 
义 相同 ， 状 态 表达 是 利用 一 种 数学 形式 来 描述 系统 所 处 的 一 种 能 量 状 
态 。 在 SA 中 ,一 个 状态 就 是 问题 的 一 个 解 ， 而 问题 的 目标 函数 就 对 应 
于 状态 的 能 量 函数 。 常 见 的 状态 表达 方法 有 适用 于 背包 问题 和 指派 问题 
的 0-1 编码 表示 法 ， 适 用 于 TSP 问题 和 调度 问题 的 自然 数 编码 表示 法 
以 及 适用 于 各 种 连续 函数 优化 的 实数 编码 表示 法 等 。 状 态 表达 是 SA 的 
基础 工作 ， 直 接 决 定 着 邻 域 的 构造 和 大 小 ， 一 个 合理 的 状态 表达 方法 会 
大 大 减 小 计算 复杂 性 ， 改 善 算法 的 性 能 。 

2. 邻 域 定义 与 移动 

同 TS 一 样 ，SA 也 是 基于 邻 域 搜索 的 。 邻 域 定义 的 出 发 点 应 该 是 保 
证 其 中 的 解 能 尽量 遍布 整个 解 空间 ， 其 定义 方式 通常 是 由 问题 的 性 质 所 
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决定 的 ， 在 前 文 介绍 的 TS 中 已 经 对 邻 域 的 定义 方法 做 了 阐述 ， 这 里 就 
不 再 对 它 加 以 讨论 了 。 

给 定 一 个 解 的 邻 域 之 后 ， 接 下 来 就 要 确定 从 当前 解 向 其 邻 域 中 的 一 
个 新 解 进行 移动 的 方法 。SA 算法 采用 了 一 种 特殊 的 Metropolis 准则 的 邻 
域 移动 方法 ， 也 就 是 说 ,依据 一 定 的 概率 来 决定 当前 解 是否 移 向 新 解 。 
在 SA 中 ， 邻 域 移动 分 为 两 种 方式 : 无 条 件 移动 和 有 条 件 移动 。 若 新 解 
的 目标 函数 值 小 于 当前 解 的 目标 函数 值 (新 状态 的 能 量 小 于 当前 状态 
的 能 量 ) ， 则 进行 无 条 件 移动 ; 否则 ， 依 据 一 定 的 概率 进行 有 条 件 
移动 。 

设 i 为 当前 解 , j 为 其 邻 域 中 的 一 个 解 ， 它 们 的 目标 函数 值 分 别 为 
JG) FG), AA 来 表示 它们 的 目标 值 增 量 ，Af =f(j) -f(i)。 

若 Af<0， 则 算法 无 条 件 从 i 移动 到 j (此 时 j 比 i 好 ); 

车 Af>0， 则 算法 依据 概率 p, 来 决定 是 否 从 i 移 向 j Oct i 


I, RE p, op -所 人 )， 其 中 7 是 当前 的 温度 。 
] 


这 种 邻 域 移动 方式 的 引入 是 实现 SA 进行 全 局 搜索 的 关键 因素 ， 能 
够 保证 算法 具有 跳出 局 部 最 小 和 趋向 全 局 最 优 的 能 力 。 当 TAK, py 
趋 近 于 1， 此 时 SA 正在 进行 广 域 搜索 ， 它 会 接受 当前 邻 域 中 的 任何 解 ， 
即使 这 个 解 要 比 当前 解 差 。 而 当 7, 很 小 时 ，ps 趋 近 于 0， 此 时 SA 进行 
的 是 局 域 搜索 ， 它 仅 会 接受 当前 邻 域 中 更 好 的 解 。 

3. 热平衡 达到 

热平衡 的 达到 相当 于 物理 退火 中 的 等 温 过 程 ， 是 指 在 一 个 给 定 温度 
T,F, SA 基于 Metropolis 准则 进行 随机 搜索 ， 最 终 达 到 一 种 平衡 状态 的 
过 程 。 这 是 SA 算法 中 的 内 循环 过 程 ， 为 了 保证 能 够 达到 平衡 状态 ， 内 
循环 次 数 要 足够 大 才 行 。 但 是 在 实际 应 用 中 达到 理论 的 平衡 状态 是 不 可 
能 的 ， 只 能 接近 这 一 结果 。 最 常见 的 方法 就 是 将 内 循环 次 数 设 成 一 个 党 
数 ， 在 每 一 温度 ， 内 循环 选 代 相 同 的 次 数 。 次 数 的 选取 同 问题 的 实际 规 
模 有 关 ， 往 往 根据 一 些 经 验 公式 获得 。 此 外 ， 还 有 其 他 一 些 设置 内 循环 
次 数 的 方法 ， 比 如 根据 温度 7 来 计算 内 循环 次 数 ， 当 7, 较 大 时 ， 内 循 
环 次 数 较 少 ， 当 7, 减 小 时 ， 内 循环 次 数 增加 。 

4. 降温 函数 

降温 函数 用 来 控制 温度 的 下 降 方式 ， 这 是 SA 算法 中 的 外 循环 过 
程 。 利 用 温度 的 下 降 来 控制 算法 的 选 代 是 SA 的 特点 ， 从 理论 上 说 ，SA 
仅 要 求 温度 最 终 趋 于 0， 而 对 温度 的 下 降 速度 并 没有 什么 限制 ， 但 这 并 
不 意味 着 可 以 随意 下 降温 度 。 由 于 温度 的 大 小 决定 着 SA 进行 广 域 搜索 
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还 是 局 域 搜索 ， 当 温度 很 高 时 ， 当 前 邻 域 中 几乎 所 有 的 解 都 会 被 接受 ， 
SA 进行 广 域 搜索 ; 当 温 度 变 低 时 ， 当 前 领域 中 越 来 越 多 的 解 将 被 拒绝 ， 
SA 进行 领域 搜索 。 若 温度 下 降 得 过 快 ，SA 将 很 快 从 广 域 搜索 转变 为 局 
域 搜索 ， 这 就 很 可 能 造成 过 早 地 陷入 局 部 最 优 状态 ， 为 了 跳出 局 优 ， 只 
能 通过 增加 内 循环 次 数 来 实现 ， 这 就 会 大 大 增加 算法 进程 的 CPU 时 间 。 
当然 ， 如 果 温度 下 降 得 过 慢 ， 虽 然 可 以 减少 内 循环 次 数 ， 但 是 由 于 外 循 
环 次 数 的 增加 ， 也 会 影响 算法 进程 的 CPU 时 间 。 可 见 ， 选 择 合理 的 降 
温 函 数 能 够 帮助 提高 SA 算法 的 性 能 。 

常用 的 降温 函数 有 两 种 : 

(1) Tu, =T, +r, 其 中 re (0.95, 0.99), r 越 大 温度 下 降 得 越 慢 。 
这 种 方法 的 优点 是 简单 易 行 ， 温 度 每 一 步 都 以 相同 的 比率 下 降 。 

(2) T, 2 T, - AT, AT 是 温度 每 一 步 下 降 的 长 度 。 这 种 方法 的 优 
点 是 易于 操作 ， 而 且 可 以 简单 控制 温度 下 降 的 总 步 数 ， 温 度 每 一 步 下 降 
的 大 小 都 相等 。 

此 外 ， 初 始 温度 和 终止 温度 的 选择 对 SA 算法 的 性 能 也 会 有 很 大 的 
影响 。 一 般 来 说 ， 初 始 温度 To 要 足够 大 ， 也 就 是 使 

f 


T x 
o 


以 保证 SA 在 开始 时 能 够 处 在 一 种 平衡 状态 。 在 实际 应 用 中 ， 要 根据 以 
往 经 验 ， 通 过 反复 实验 来 确定 T 的 值 。 而 终止 温度 7/ 要 足够 小 ， 以 保 
证 算法 有 足够 的 时 间 获 得 最 优 解 。7/ 的 大 小 一 般 可 以 根据 降温 函数 的 形 
式 来 确定 ， 若 降温 函数 为 Ta = 7,* r， 则 可 以 将 7 设 成 一 个 很 小 的 正 
B Æ Ta = Ty -AT， 则 可 以 根据 预先 设 定 的 外 循环 次 数 和 初始 温度 
T, 计算 出 终止 温度 7 的 值 。 


5.3.2 算法 的 计算 步骤 和 流程 图 


一 个 优化 问题 可 以 描述 为 
min f(i), ie S 

其 中 ，5 是 一 个 离散 有 限 状态 空间 ，i 代表 状态 。 针 对 这 样 一 个 优化 问 
Bi, SA 算法 的 计算 步骤 能 够 描述 如 下 : 

第 1 步 : 初始 化 ， 任 选 初始 解 ie S， 给 定 初始 温度 T, 和 终止 温度 
T， 令 迭代 指标 =0, T, = Tos 

第 2 步 : 随机 产生 一 个 邻 域 解 je N(i) (NG) 表示 i 的 邻 域 ), 计 
算 目 标 值 增 量 Af=f(j) -f(i)。 

第 3 步 : 若 Af<0, 令 i=j 转 第 4 步 ; 否则 产生 二 = UV(0，1)， 若 
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a| x) >£, HIA izje 
第 4 步 : 若 达到 热平衡 〈 内 循环 次 数 大 于 n( Ti) ) 转 第 5 步 ; 否则 
转 第 2 步 。 


第 5 步 : 降低 7T,, k=k+1, AT <7T， 则 算法 停止 ， 否 则 转 第 
2 步 。 


根据 上 述 计算 步骤 ，SA 的 流程 图 能 够 表示 为 如 图 5. 2 所 示 。 


产生 ies, k-0,T,-T, 


BE n(T,) ,n=0 


PETES n n*l 
iC A F0) 


pp 一 wo 一 
exp( - A//T, ^5, £-U(0,1)7 
E ce 


图 5.2 模拟 退火 算法 流程 图 


5.3.3. 一 个 简单 的 算 例 


下 面 以 一 个 简单 的 例子 来 说 明 SA 是 怎么 工作 的 。 

1. 问题 提出 

以 一 个 简单 的 单机 极 小 化 总 流水 时 间 的 排序 问题 为 例 : 设 有 四 个 工 
件 需 要 在 一 台 机 床上 加 工 ，P, =8，P, =18，P, =5，P, =15 分 别 是 这 
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四 个 单 道 工序 工件 在 机 床上 的 加 工时 间 ， 问 应 如 何在 这 个 机 床上 安排 各 
工件 加 工 的 顺序 ,使 工件 加 工 的 总 流水 时 间 最 小 ? 

2. 预备 知识 

工件 的 流水 时 间 (Flowtime) 即 工件 在 系统 中 的 总 逗留 时 间 ， 流 水 
时 间 用 于 度量 系统 对 各 个 服务 需求 的 反应 ， 表 示 工 件 在 到 达 和 离开 系统 
的 时 间 长 度 。 在 本 例 中 , 令 所 有 工件 都 在 时 间 0 到 达 ， 则 工件 的 流水 时 
间 就 等 于 它 的 完工 时 间 。 

对 于 这 种 总 流水 时 间 问 题 可 以 用 工件 加 工时 间 的 非 减 顺序 来 调度 工 
件 ， 也 就 是 著名 的 最 短 加 工时 间 调 度 规则 (SPT 规则) 。 那 么 按 SPT 规 
则 ， 本 例 中 保证 总 流水 时 间 最 小 的 最 优 的 工件 加 工 顺序 为 3 一 1 一 4 一 2， 
它 的 总 流水 时 间 F 可 以 计算 如 下 

Fiy =P 

Fin =P +Po 

Fin = Pin + Pray +Po 

Fu; = Pry + Peay + Pray + Pray 


4 
于 是 , F= [Puy Pos Po Pial : -24x543x842x154 
1 
1x18 =92 
注释 : GRUB [A] 表示 排 在 第 上 位 的 工件 的 标号 。 如 : 工件 3 排 在 
第 1 位 , M [1] =3。 
3. 用 SA 求解 这 个 问题 
(1) 状态 表达 


本 例 中 状态 采用 一 种 顺序 编码 来 表达 ， 其 中 工件 是 按 加 工 的 顺序 排 
列 的 。 例 如 ， 对 于 一 个 工件 的 加 工 顺序 
2 一 4 一 1 一 3 
可 简单 的 表示 为 
(2 4 1 3] 
(2) PREX 
对 于 采用 顺序 编码 的 状态 表达 方法 来 说 ， 最 自然 的 邻 域 可 以 定义 为 
工件 顺序 中 两 两 换 位 的 集合 。 例 如 ， 从 一 个 当前 状态 
[2 4 1 3] 
对 其 中 的 两 个 工件 进行 换 位 (2 与 1 进行 换 位 ) ， 则 获得 了 一 个 新 状态 
[1 4 2 3] 
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这 样 就 完成 了 一 次 邻 域 移动 。 
(3) 温度 参数 设置 
设 初始 温度 T, 2100, 终止 温度 T=60。 
降温 函数 定义 为 7,,, = T, -AT， 其 中 AT=20。 
热平衡 达到 
通过 设置 内 循环 的 迭代 次 数 n(7,) 来 实现 热平衡 ， 这 里 设 
n(T,) =3。 
4. SA 的 求解 过 程 
随机 产生 一 个 初始 解 1= [1 42 3] ， 其 目标 函数 值 /(i) 2118, SA 
开始 运行 。 
(1) 当前 温度 7 =100， 进 入 内 循环 ， 令 内 循环 次 数 n=0。 
@ 内 循环 次 数 n 加 1， 随机 产生 一 个 邻 域 解 j=[1 3 2 4] (此 时 4 
和 3 换 位 ) ， 其 目标 函数 值 /(j) =98; 计算 目标 函数 值 增 量 Af= -20， 
由 于 Af<0， 故 进行 无 条 件 转 移 ， 令 i =j。 
@nen +1, je[432 1], fG) =119; 计算 Af=21， 由 于 Af>0， 
故 进行 有 条 件 转 移 ， 计 算 
e 520.810 6 
随机 产生 Ee U (0, 1), £50.741 4， 因 为 
e^ =0. 810 6 >0. 741 4(£) 
所 以 进行 邻 域 移动 ， 令 i =j。 
@nen+1, j= [4231], fG) =132， 因 为 
e¥=0.878 1>0.399 1 (£) 
所 以 进行 有 条 件 转移 ， 令 i=j。 
注释 : 在 @@ 中 ， 虽 然 目标 值 变 大 ,但 是 搜索 范围 变 大 。 
(2) 降低 温度 ，T, =100 -20 =80, n=0。 
(nen 41, j2[4213], fG) =135， 因 为 
e^ 5 20.963 2 20.341 3(£) 
所 以 进行 邻 域 移动 ， 令 i =j。 
@nen+1, j= [4312], fG) =109， 因 为 
Af= -26<0 
进行 无 条 件 转 移 ， 令 i =j。 
@nen+1, j= [4321], fü) =119, 因为 
e^ =0. 882 5 >0. 928 6(£) 
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所 以 ,不 进行 邻 域 移动 ， 令 i =i。 

注释 : 在 @ 中 ， 由 于 产生 的 伪 随 机 数 & 大 于 转移 概率 e, 所 以 系 
统 会 停留 在 4 一 3 一 1 一 2 状态 ， 目 标 值 仍 然 为 109 。 

(3) 降低 温度 ,7T, =80 -20 =60, n=0 

O nen4+1, j= [1342], fG) =95， 因 为 

Af- -24 «0 
所 以 进行 无 条 件 转 移 ， 令 i =j。 
Q nen+1, f=(3 142], fü) =92， 因 为 
Af= -3«0 
进行 无 条 件 转 移 ， 令 i =j。 

@nen+1, j= [2143], fG) =131, 因为 

e^ 20.5220 >0.7105 (£) 
所 以 ,不 进行 邻 域 移动 ， 令 i =i。 

SA 停止 运行 ， 输 出 最 终 解 i= [3 1 4 2] ， 也 就 是 说 ， 终 止 于 状态 
3 一 1 一 4 一 2 ， 目 标 函 数值 为 92 。 

虽然 在 这 个 简单 的 算 例 中 ，SA 终止 于 最 优 解 ， 但 是 在 实际 应 用 过 
程 中 想 做 到 这 一 点 ， 就 必须 在 算法 设计 过 程 中 同时 满足 下 列 条 件 : 

D 初始 温度 足够 高 。 

[^E 热平衡 时 间 足 够 长 。 

@ 终止 温度 足够 低 。 

@ 降温 过 程 足 够 慢 。 

以 上 条 件 在 实际 应 用 过 程 中 很 难 同时 得 到 满足 ， 而 且 SA 会 接受 性 
能 较 差 的 解 ， 所 以 其 最 终 解 有 可 能 比 运算 过 程 中 遇 到 的 最 好 解 性 能 差 ， 
因此 在 SA 运行 过 程 中 常常 要 记录 遇 到 的 最 好 可 行 解 (历史 最 优 解 )， 
当 算法 停止 时 ， 输 出 这 个 历史 最 优 解 。 


5.4 算法 的 收敛 性 分 析 
与 前 文 介绍 的 遗传 算法 GA 和 禁忌 搜索 TS 相 比 ，SA 的 一 大 优点 是 
理论 较为 完善 ， 下 面 就 基于 Markov 过 程 来 分 析 SA 算法 的 收敛 性 。 
5.4.1 Markov 过 程 


Markov 链 最 初 是 由 Markov 于 1906 年 研究 而 得 名 ， 至 今 它 的 理论 已 
发 展 的 较为 深入 和 系统 ， 在 自然 科学 、 工 程 技术 及 经 济 管理 等 各 个 领域 
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得 到 广泛 的 应 用 ， 本 节 将 利用 Markov 链 作为 描述 和 分 析 SA 算法 的 数学 
工具 ， 首 先 介绍 一 些 基本 的 概念 。 

1. Markov 链 

状态 : 表示 每 个 时 刻 开始 处 于 系统 中 的 一 种 特定 自然 状况 或 客观 条 
件 的 表达 ， 它 描述 了 研究 问题 过 程 的 状况 。 描 述 状态 的 变量 称 为 状态 变 
量 ， 可 用 一 个 数 ， 一 组 数 或 一 向 量 (多 维 情况 ) 来 描述 。 

状态 转移 概率 : 表示 在 某 一 时 刻 从 状态 i 转移 到 状态 j 的 可 能 性 。 

无 后 效 性 : 如 果 在 某 时 刻 状态 给 定 后 ， 则 在 这 时 刻 以 后 过 程 的 发 展 
不 受 这 时 刻 以 前 各 段 状 态 的 影响 。 换 名 话说， 达到 一 个 状态 后 ， 决 策 只 
与 当前 状态 有 关 ， 而 与 以 前 的 历史 状态 无 关 ， 当 前 的 状态 是 以 往 历史 的 
一 个 总 结 。 这 个 性 质 就 称 为 无 后 效 性 。 


根据 上 述 概念 ， 令 离散 参数 7 了 = 10, 1, 2, …| = Ne， 状态 空间 
5=10,1,2,…|}， 如 果 随 机 序列 1., nz01 对 于 任意 S, hs ons 
i,, ia ES, neN 及 
P [X =i, X% =i, os, X =i} >0 
存在 


PIX... Eia l X mh X =i ,=i 
=P|X =i |X, mill (5.9) 
则 称 其 为 Markov 链 。 式 (5.9) 刻画 了 Markov 链 的 无 后 效 性 ， 若 S 有 
限 ， 则 称 为 有 限 状 态 Markov 链 。 
对 于 Yi, jes, Fk 
P|X, =j! X, =i} Ap,(n) (5.10) 
为 n 时刻 的 一 步 转移 概率 。 
若 对 于 Yi, jes, FE 


p,(n) =py (5.11) 
B] p, n HK, 则 称 (X, n0] 为 齐 次 Markov 链 。 记 己 =(Py) ， 称 
PH |X n20] 的 一 步 转移 概率 矩阵 。 记 By” =PIX。=J1 Xo cil 为 
n 步 转移 概率 ，P'” = (pi) 为 n 步 转移 概率 和 矩阵。 
为 了 直观 了 解 Markov 过 程 中 的 无 后 效 性 ， 下 面 用 一 个 青蛙 在 石头 
上 随机 跳动 的 例子 来 说 明 这 个 问题 。 用 石头 来 表示 状态 ，X, 则 表示 青蛙 
在 时 刻 n 所 处 的 石头 ，(X,=i) 表示 青蛙 在 时 刻 n 处 在 石头 i 上 这 一 随 
机 事件 。 如 果 把 时 刻 n 看 做 是 “现在 "， 时 刻 0，1，…, n -1 表示 
“过 去 "， 时 刻 n+1 表示 “将 来 ”"， WAR (5.9) 表示 在 过 去 X = 
ig, ot, Xj. =i RARE X, =i, 的 条 件 下 ， 青 蛙 在 将 来 时 刻 n+l 跳 到 
石头 去 ,的 条 件 概率 ， 只 依赖 于 现在 发 生 的 事件 (X, =i), MSAA 
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历史 曾经 发 生 过 的 事件 无 关 。 简 而 言 之 ， 在 已 知 “ 现 在 ”的 条 件 下 ， 
“将 来 ”与 “过 去 ”是 独立 的 。ps(n) 表示 青蛙 在 时 刻 n 由 石头 i 出 
发 ， 于 时 刻 n+1 跳 到 石头 j 的 条 件 概 率 ， 而 齐 次 性 p,(n) =ps 表 示 此 转 
移 概率 与 时 刻 n 无 关 。 

2. 以 青蛙 跳动 为 例 说 明 状 态 转移 概率 

假设 青蛙 在 3 块 石 头 上 随机 跳动 (如 图 5.3 所 示 ) ， 且 跳动 具有 无 
记忆 性 的 特点 ， 也 就 是 无 后 效 性 。 状 态 转移 概率 矩阵 P 为 


上 | 一 nj- vj- 
bb| 一 èj- v|- 
|= aj- 由 | 一 


图 5.3 青蛙 跳动 图 示 
设 开 (5) = [m (t) om (D ,Ts(t)] 表 示 上 时 刻 青 蛙 处 在 各 石头 上 
的 概率 分 布 向 量 ， 开 (+) 是 一 个 行 向 量 ， 则 在 :+1 时 刻 有 
H(t*1) 2H(0) +P (5.12) 
HP, m0) 表示 上 时 刻 青蛙 处 在 石头 ;上 的 概率 ，m =3。 
若 青蛙 0 时 刻 处 在 第 1 块 石 头 上 ， 也 即 是 ,在 0 时 刻 ， 有 
H(0)-[1 0 0] 
于 是 ， 根 据 状态 转移 概率 矩阵 P 可 计算 青蛙 在 时 刻 1，2，… 处 于 各 石 
头 上 的 概率 向 量 


na) =) - P=| > E x] 
H(2)-HQ): P= 
假设 系统 在 上 +1 时 刻 达到 稳 态 ， 则 存在 
limH(t +1) = lim/T(t) =I 
JOH, = [ri ,7,，,…,7,] 为 系统 达到 稳 态 时 的 状态 概率 分 布 向 量 。 由 
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根据 式 (5.12) 可 得 
W(t+1) =M(t)  T23II =H -T 


X 
X 7,71 
故 可 得 如 下 线性 方程 组 
[msma m, P Lm mm] 
{ (5.13) 
Tm; m, =l 


值得 注意 的 是 ， 由 于 状态 转移 矩阵 己 的 秩 R(P) =n -1， 故 方程 组 
(5.13) 存在 唯一 的 解 。 
在 上 面 给 出 的 小 例子 中 


过 
2 


iunt m, + m, =m, 
1 1 1 
i 
1 1 1 
本 
T, *t7,*7,-7] 
解 这 个 线性 方程 组 ， 求 得 
167" 
57 
n-|2 


从 这 个 计算 结果 可 以 看 出 ， 当 系统 达到 稳 态 时 ， 青 蛙 跳 到 第 三 块 石头 上 
的 机 会 要 多 一 些 ， 而 跳 到 第 一 块 石头 上 的 概率 最 小 。 

3. SA 算法 的 Markov 描述 

下 面 考察 一 下 模拟 退火 算法 的 搜索 过 程 ， 算 法 从 一 个 初始 状态 
开始 后 ， 每 一 步 状态 转移 均 是 在 当前 状态 i 的 邻 域 N(i) 中 随机 产 
生 一 个 新 状态 j， 然 后 以 一 定 的 概率 进行 接受 的 。 可 见 ， 接 受 概率 
仅 依 赖 于 新 状态 和 当前 状态 ， 并 由 温度 加 以 控制 。 因 此 ，SA 算法 
对 应 一 个 Markov 链 。 若 固定 每 一 温度 7 ， 算 法 计算 Markov 链 的 变 
化 直至 平稳 分 布 ， 然 后 降低 温度 ， 则 称 这 种 SA 算法 是 齐 次 的 。 若 
无 需 各 温度 下 算法 均 达到 平稳 分 布 ， 但 温度 需 按 一 定 的 速率 下 降 ， 
则 这 种 SA 算法 是 非 齐 次 的 或 非 平 稳 的 。 这 里 仅 对 齐 次 SA 算法 的 收 
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得 性 进行 分 析 。 

Markov 链 可 以 用 一 个 有 向 图 G(V, E) RR, HPV 为 所 有 状态 
构成 的 顶点 集 , E = | (i, j)li, jeV, jeN (i)| 为 边 集 。 

记 as 为 当前 状态 i 接受 状态 j 的 概率 ,按照 SA 的 计算 方法 ， 接 受 
概率 如 下 : 

当 i>j 时 有 f(i) >f(j) ，SA 进行 无 条 件 转移 ，as(1) =1 

4i<j HA SG) >f), SA 进行 有 条 件 转 移 , 0 < ay (t) = 
ev( - KR AD =f) «i 


HHS (+) 为 目标 函数 ，: 为 温度 参数 。 

以 上 讨论 的 仅仅 是 在 状态 i 已 经 选择 了 状态 j 时 接受 状态 j 的 概 
率 ， 那 么 在 状态 i 究竟 有 多 大 的 概率 选择 状态 j 呢 ? 这 是 下 面 要 讨论 
的 问题 。 

记 gy 为 由 状态 i 选择 状态 j 的 概率 ， 则 

BED jemi) 
-| g(i) 
0,  jeN(i) 
其 中 
a) = > aJ) 


iTo 


它 通常 与 温度 无 关 。 ae per ee ee 则 


glij) - 
gl) ELOI 


其 中 ，IN(i) 1 为 状态 i 的 邻 域 中 状态 总 数 。 

状态 i 到 状态 j 的 状态 转移 发 生 的 条 件 是 i 选择 j 并 接受 j， 记 ps 为 
由 状态 i 到 状态 j 的 转移 概率 ， 则 根据 上 面 两 个 概率 gs 和 av 就 能 够 计算 
转移 概率 。 对 于 任意 i, j, 有 

(1) Hjsi RjeNG) 时 

Py(t) =as(t) * gy 
(2) 4j#iAsjeN() 时 
p(t) =0 


(3) 当 j=i 时 
py(t) =1- 2: [NORIS 
因此 ， 状 态 转移 概率 矩阵 PH 
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1- Y angu En 4s Ew 
f 
En 1- > augu Rm cU Ew 
P = I 
m " go) oe mu, 
m m m > emgm 


(5.14) 
若 存在 这 样 一 个 优化 问题 
min f(x) 
HH, xeS，S 是 有 限 集 ， 设 1S| - N 表示 S 集中 的 元 素 个 数 为 V， 在 
不 失 一 般 性 的 前 提 下 ， 让 状态 按 目 标 函数 值 进行 升序 编号 ， 即 
f(x) Sr) < <f(xn) 
下 面 分 两 种 情况 来 讨论 状态 转移 概率 矩阵 P。 
第 一 种 情况 : 当 tm 时 ， 
对 于 Yj>i， 可 做 如 下 推导 
j>i=f(i) M». fi) -fG) oge 22 
tow t 
也 就 是 
a,(t)—1 
MEVi<i, BUF JG) <f(i) ， 所 以 进行 无 条 件 转移 ， 也 就 是 
a,(t) =1 
因此 
Jim a,(t) -1, Vjsi 
根据 上 面 的 推导 ， 易 知 当 Ico 时 ， 从 当前 状态 i 向 状态 空间 S 内 其 他 
所 有 的 状态 进行 转移 的 概率 都 相等 旦 大 于 0， 故 当前 状态 i 的 邻 域 中 的 
ARAS BONING) =N-1, H 
1 
Eig -1 
根据 式 (5.14) WA, Mr 时 


» Vjži 


1 cro 
a(T)g, "ly 17 yu! 
p, (7) = 1 
1- PolT)g = 1-(N-D yy =O =F 
zi 


N-1 
因此 ， 当 :一 % 时 ， 状 态 转移 概率 矩阵 P 为 
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N-1 
第 二 种 情况 : 当 10 时 ， 
对 于 Vj>i， 可 作 如 下 推导 
e SG) -fG) ， uu nih ug 
10 t 
也 就 是 
a,(1) ^0 
MEV <i， 由 于 j <i 一 10) Sf), BUEGOGARIERCRS, dusk 
a,(t) =1 
因此 
0, joi 
ime, Of 
根据 式 (5.14) BTR, M0 时 
a,(t)g, 20:g; 20,j >i 
aj(t)g, "lg; 7 goj «i 


1- EOnst-Y adi 


因此 ， 当 :0 时 ， 状 态 转移 概率 矩阵 了 为 
1 


Pi(t) = 


1 
gn 1- g: 0 
n È En 
2 
P =| g¢. g: TASE 
a " à » 
va 
gm Bm Em Uode È Em 
= 


此 时 , P 为 一 个 下 三 角 和 矩阵 ， 值 得 注意 的 是 P 的 第 一 个 行 向 量 是 
[1 0 … 0], mE 150 时 ,任何 状态 一 旦 到 达 状 态 1 将 无 法 转 
出 ， 这 种 情况 称 为 状态 1 是 “捕捉 的 "， 也 就 是 说 当 青蛙 跳 到 第 1 块 石 
头 上 后 就 无 法 跳出 了 。 
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无 论 从 实际 还 是 从 直观 上 来 看 ， 模 拟 退 火 算法 要 实现 全 局 收敛 ， 它 
必须 满足 以 下 条 件 : 

@ 状态 可 达 性 ， 也 就 是 说 ， 无 论 起 点 如 何 ， 任 何 状态 都 是 可 以 到 
达 的 。 

© 初 值 鲁 棒 性 ， 由 于 初 值 的 选择 具有 非常 大 的 随机 性 ， 因 此 ， 算 
法 达到 全 局 最 优 应 不 依赖 初 值 。 

图 极限 分 布 的 存在 性 ， 包 含 两 个 方面 的 内 容 : 其 一 是 当 温度 不 变 
时 ,其 Markov 链 的 极限 分 布 存在 ; 其 二 是 当 温 度 趋 近 于 0 时 ， 其 
Markov 链 也 有 极限 分 布 ， 且 最 优 状 态 的 极限 分 布 和 为 1。 

下 一 节 就 从 理论 上 来 分 析 SA 算法 的 收敛 性 。 


5.4.2 SA 的 收敛 性 分 析 


引 理 5.1; 当 7, 一 0 时 ， 系 统 达 到 稳 态 时 的 状态 概率 分 布 向 量 
[1 0 … 0]。 


证 明 : 
Wal, mw] 为 系统 达到 稳 态 时 的 状态 概率 分 布 向 
R, FOP oo 是 稳 态 时 系统 处 于 状态 i 的 概率 , m 20, i=l, 2,…， 


因为 系统 达到 稳 态 ， 所 以 有 


H-H:P 
4 了 一 0 时 
1 
A 
1- 0 
£n à Bu 
2 
P = | gy En 1- Y en 
[i 
va 
Em Em Em sed A En 


因此 
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u 


7; wy] = [mi 7; ty] 
1 
1 
1- 0 
En 2: Bu 
2 
Ba En 1- >) Eu 
fa 
"a 
8 &, gı e dec di 
m m m > m 


TH, = Mi +M,’ By + + TW! Bm 


i 
Sm, nin 
2 


=> Ti ga = 0 
可 见 ， 当 i>1 时 ， 7,20, 6, 2054 ga >0， 则 m, 20. 
因此 ， 当 7, 一 0 时 ， 系 统 达 到 稳 态 时 的 状态 概率 分 布 向 量 T = 
0 … 0]。 
证 毕 。 
定理 5.1: 若 选择 概率 矩阵 对 称 ， 即 对 于 Yiz#j， 存 在 gy =g W 


当 达 到 热平衡 时 ， 对 所 有 T, > 0 存在 


WT) = m (TO an (MT) as(T) … an(T)] 
证 明 : 
当 在 温度 7, 下 达到 热平衡 时 ， 有 
m (T) p, UT) 2m, (T p, CT.) 


当 i=1 时 
m (Tp) =m;(T,)pa (T) 

m (Tea (T,) 2 m,(T,)ggaa CT) 
由 于 

j»l2ofG)zf()5VT,, 3a, =1 
X 

£y 7 Es 

所 以 


m, (T,)ay(T,) = (Ty) j=2, 3, =, N 
因此 ， 对 于 所 有 T, >0， 当 达到 热平衡 时 
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HC) =[m(T) (OO) m) … m((0)] 
2[mO m, (T,)an(T,) m,(T,)an(T,) m, (Ty aw( Ty) ] 
=m (T,)[1 an) as) … am(T)] 
证 毕 。 


由 以 上 定理 可 知 ， 当 TEEF O 时 ， 对 于 所 有 状态 > 1， 有 
a,,(7,) BET 0, m,(T,). 趋 近 于 1， 即 SA 算法 对 应 的 Markov 过 程 将 
以 概率 1 收敛 于 状态 1， 即 目标 值 小 的 状态 。 


5.5 应 用 案例 


5.5.1. 成 组 技术 中 加 工 中 心 的 组 成 问题 


1. 问题 描述 

成 组 技术 中 加 工 中 心 的 组 成 问题 : HA m 台 机 器 ， 要 组 成 若干 个 
组 成 中 心 ， 每 个 加 工 中 心 可 最 多 有 9 台 机 器 、 最 少 p 台 机 器 ， 有 n 种 工 
件 要 在 这 些 机 器 上 加 工 ， 已 知 工件 和 机 器 的 关系 矩阵 4， 

A- [ay] " = 机 器 i 为 工件 j 所 需 
Eu p 其 他 

问 如 何 组 织 加 工 中 心 ， 才 能 使 总 的 各 中 心 的 机 器 相似 性 最 好 ? 

用 上 上 表示 可 能 的 加 工 中 心 数 ， 则 存在 


[NET 
其 中 ,ko = [o] se [7]; n emit vo iat 


数 。 
用 5 表示 机 器 i 与 机 器 j 的 相似 系数 ， 则 
ny 
S,e(0, 1], ase 
0 
其 中 ，n, 为 工件 需 在 机 器 i 和 j 上 加 工 的 数量 ; nm 为 工件 需 在 机 器 站 上 加 
工 的 数量 。 举 例 来 说 ,假设 8 个 工件 在 机 器 i 和 j 上 加 工 ， 工 件 和 机 器 

的 关系 矩阵 4 为 


.d$j 


> taj 


于 是 
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2 


S,= = 
$7544-2 


2 
7 
2. 模型 建立 
决策 变量 有 两 个 : x 用 来 表示 机 器 i 是否 指 定 于 加 工 中 心 *，y 表 
示 是 否 组 成 加 工 中 心 k， 即 
位 机 器 i 指定 于 中 心 & i=l, 2, =, m 


B 其 他 k=1, 2, —, kag 
1, 组 成 中 心 
a nC 2 
根据 决策 变量 ， 建 立 加 工 中 心 成 组 优化 的 数学 模型 如 下 : 
max y Y P S xata (5.15) 
st Ei xa 2d, 21,2,,m (5.16) 
> xa S isk = 1,2, ykua (5.17) 
Y xa 2 py,,k = 3,2, (5.18) 
xay, = OMI, Vk (5.19) 


目标 函数 是 使 成 组 的 相似 性 极 大 化 ， 也 就 是 期 望 将 所 有 相似 的 机 器 
放 在 同一 个 中 心 ; 约束 条 件 (5.16). 用 于 指定 唯一 性 ， 以 保证 每 个 机 
器 只 能 放 在 一 个 加 工 中 心 ; 约束 条 件 (5.17) 保证 每 个 中 心 的 机 器 数 
要 小 于 其 最 大 容量 p 台 ; 约束 条 件 (5.18). 保证 每 个 中 心 的 机 器 数 要 
大 于 其 最 大 容量 4 台 ; R (5.19) 为 决策 变量 。 

这 是 一 个 典型 的 二 次 指派 问题 ， 其 中 决策 变量 有 mx kas + ku, 
HREH m 2k, EMX kuan + 有 as 个， 用 普通 的 二 次 0- 工 规划 方法 求 
解 ， 由 于 变量 数 较 多 ， 处 理 起 来 比较 困难 ， 因 此 采用 模拟 退火 方法 对 这 
个 模型 进行 求解 。 

3. 模拟 退火 算法 

状态 表达 : 采用 自然 数 编码 作为 状态 表达 方法 ， 设 x = 大 表示 机 器 
ife, Wee [x m2, cos xu] 就 可 以 表示 一 个 状态 ， 利 用 这 种 
编码 方法 就 使 得 原 问题 等 价 于 一 个 天 分 图 问题 。 

目标 函数 : 由 于 该 问题 是 一 个 有 约束 的 优化 问题 ， 而 SA 用 于 求解 
无 约束 问题 ， 故 首先 需要 将 上 述 模型 转化 为 如 下 无 约束 模型 : 
i 6e» -(£)x dere 


eh, ity fete 
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其 中 ,a 和 有 是 罚 因子 ;7, 是 温度 参数 ， 可 见 随 着 算法 的 运行 (7 3E 
浙 下 降 ) ， 罚 因子 会 逐渐 增 大 ， 这 就 保证 了 算法 在 开始 阶段 进行 广 域 搜 
索 ， 到 了 终止 阶段 进行 局 域 搜索 。 
忆 = {v1，v，，…， v4]} 表 示 集 类 ， 它 是 集合 的 集合 ; v = {il 0, = RYE 
合 ; Ph= {veP.|lv|>q} 机 器 数 超标 的 中 心 集合 ; PI= lo e 
P, | |v | «pl. 机 器 数 不 够 的 中 心 集合 。 
举例 来 说 ， 对 于 这 样 一 个 问题 ， 
p=2,q=5,x= [211233221 3] 
此 时 ， 
vy, ={2, 3, 9}, |v, | -3 
v,={1, 4, 7, 8}, lv] =4 
%={5, 6, 10}, |¥5|=3 
邻 域 : 从 当前 状态 = [ns ns ns xu] 中 随机 选择 一 个 % ， 改 变 
其 位 值 ， 这 样 就 产生 了 一 个 邻 域 点 ， 故 邻 域 的 大 小 为 m(ko -1)。 
内 循环 次 数 : n( Tt) o m - 1) ， 其 中 上 为 迁 代 指标 。 


n m 
REMIT... = 也, 其 中 = E bo = Dp 
为 一 个 控制 参数 。 
DR. 5. 12al-e. FRENE, TH 7 很 大 时 ， 温 度 下 降 的 速度 
很 快 。 


5.5.2 准时 化 生产 计划 问题 


1. 准时 化 生产 计划 

20 世纪 70 年 代 末 ， 准 时 化 (UIT). 生产 技术 在 日 本 成 功 地 提出 。 
由 于 它 能 大 幅度 地 减少 生产 和 存储 费用 ， 因 此 吸引 了 许多 学 者 去 研究 
JIT 环境 下 提前 / 拖 期 生产 计划 问题 。 半 无 限 规划 模型 准确 地 描述 了 提 
前 / 拖 期 生产 计划 问题 ， 只 是 模型 中 有 无 限 多 非 凸 约 束 ， 求 解 比较 困难 。 
目前 求解 该 模型 比较 有 效 的 方法 是 遗传 算法 ， 但 是 用 遗传 算法 求解 半 无 
限 规划 模型 存在 一 些 缺 点 ， 如 占用 内 存 大 、 计 算 量 大 、 运 算 时 间 长 、 不 
能 保证 解 的 最 优 性 等 。 下 面 用 模拟 退火 结合 启发 式 算法 和 最 速 下 降 法 求 
解 半 无 限 规划 模型 ， 此 算法 可 以 跳出 局 部 最 优 解 ， 并 且 以 概率 KAF 
全 局 最 优 解 。 

2. 半 无 限 规划 模型 的 建立 

假设 制造 商 在 [0, T] 计划 生产 时 期 内 收 到 = 个 订货 。 在 JIT 环境 
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下 ,决策 者 希望 计划 生产 完成 时 间 尽 可 能 接近 顾客 要 求 的 交 货 期 。 通 过 
使 用 一 个 二 次 惩罚 函数 ， 可 以 得 出 提前 / 拖 期 生产 的 半 无 限 规划 模型 


min Y a,(x, - d)? (5.20) 
st Y R(ti,x) < G(t),t e [0,7] (5.21) 
O<L, €x «T, -1,2,7,n (5.22) 


Ht, LEIK i WEAR, ， 顾 客 要 求 的 交 货 期 是 d, 计划 完 成 时 间 
是 x,， 资 源 需 求 函 数 由 R(t,， x), te [0, T] dm. T 时 刻 可 采用 的 
YEW C(t); o, 是 惩罚 系数 。 根 据 生产 实际 ， 假 设 资源 需求 函数 是 近 
似 于 正 态 分 布 的 曲线 ， 即 

(t-x, ry) 


c, 


Rs x) =aerp| - ,iz1,2, 5, (5.23) 


其 曲线 如 图 5.4 所 示 。 等 式 (5.23) 只 是 实际 资源 需求 函数 的 一 个 近 


MRAR. IER a P(E), ets n 


wb d x, 


t 
图 5.4 资源 需求 函数 曲线 图 
设 开始 可 采用 的 资源 是 g。， 它 随时 间 的 增加 以 速率 8 增长 。 假 设 
在 [0, T] 内 有 mm 个 跟 留 工作 ， 其 中 每 一 个 工作 需要 一 定 的 资源 ， 由 
下 面 的 近似 等 式 确定 (j=1,2，…，m)。 
G-g) 
90 zage) -“ GE], te to. 71 


'j 


其 中 参数 W ，g， 万 与 a;，b;，c; 同 样 的 方法 求 得。 因此 ， 可 采用 的 资源 
函数 变 为 


GC) = g,exp(Bt) - > Q,(t),t e [0,7] 


3. 模拟 退火 算法 

这 里 采用 模拟 退火 算法 求解 半 无 限 规划 模型 ， 分 3 个 阶段 : 先 用 启 
发 式 算法 得 出 一 个 较 好 的 初始 解 ， 再 用 模拟 退火 算法 结合 最 速 下 降 法 对 
初始 解 中 时 间 x, 的 顺序 进行 优化 ， 最 后 用 模拟 退火 算法 对 第 二 阶段 的 结 
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果 进 行 微调 ， 求 最 优 解 。 由 于 模拟 退火 算法 适用 于 无 约束 函数 ， 这 里 采 
用 一 种 非 精 确 方法 将 约束 通过 惩罚 项 结合 到 目标 函数 中 。 

HFR, (t, x). (i=1, 2, =, n) 是 近似 于 正 态 分 布 的 曲线 ， 所 
以 可 以 证 明 不 等 式 (5.21) 左 侧 最 多 有 n 个 局 部 极 大 值 ， 并 且 位 于 
[x -L,, xj) (i21, 2, =, n) 内 。 设 


1j = arg max | > R(t,x) - G(t) | x; - L; < t < x} 


@(t,,X) = Y Rí(t,x,) - G(1) j = 1,2,-,n 
BA (5, X) >0 就 意味 着 违反 (SIP) MAR (5.21), WAR 
(5.21) 若 给 定 一 个 允许 误差 s， 则 所 有 违反 约束 (5.21) 的 点 的 集合 
为 V= {61j=1, 2, =, n, ® (1, X) >e}, BA, HARAAA 
目标 函数 中 得 到 新 的 目标 函数 为 


min Y alx- d)? «a Y (X) 
其 中 心 是 足够 大 的 惩罚 系数 。 
(1) 用 启发 式 算法 求 初始 解 
如 果 随 机 产生 一 个 初始 解 ， 高 温 退 火 过 程 比较 长 。 为 减少 运算 时 


间 ， 用 较 快 的 启发 式 来 代替 高 温 退 火 ， 得 出 一 个 比较 好 的 初始 解 。 根 据 
实际 经 验 ， 为 减少 总 的 惩罚 ， 对 于 惩罚 大 的 、 资 源 需求 少 的 订货 ， 应 该 


尽量 减少 提前 / 拖 期 的 时 间 ， 即 以 天 (= 1，2，…，n) 的 值 确定 优先 


级 ,大 的 先 考虑 。 具 体 算法 如 下 。 
第 1 步 : 确定 计划 水 平 了 
a Sp+> a) 
T=maxj_\fi fi I 
EJ 


, max [dil i=l, 2, =, n] 


第 2 步 : Hu =F (i=1，2，…，n)， 并 对 u 从 大 到 小 排序 得 


Uy, Uy, cH, Uy 

第 3 步 : Wh uy, uus nsu, 为 优先 级 分 别 求 各 订货 的 生产 完成 时 
GES 

Ox,=d,, MRS (4, X) >0 (te [d -L, d]), 转 @; 

Q XE k-1, 2, =, d -L,, WKHH y, =d; -k EP) (5, X) <0。 
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计算 提前 惩罚 a -o(d,-y), #9; 否则 a=M (M 是 大 的 数 )， 

图 对 上 =1, 2, =, T-d,, RKR z =d; +k HB) (t, Z) «0, 
计算 拖 期 惩罚 b=a(z 7d); BM b -M; 

@ 比较 a、b， 取 最 小 惩罚 的 s. WR asb, Rx 2y, 否则 xz. 

(2) 用 模拟 退火 算法 (SA1) WÈ x, (G=1, 2, =, n) 顺序 

由 于 模拟 退火 算法 接受 使 目标 值 变 坏 的 解 ， 所 以 最 终 解 有 可 能 比 计 
算 过 程 中 遇 到 的 最 好 解 坏 。 对 模拟 退火 算法 稍 加 改进 ， 即 保存 遇 到 的 最 
好 可 行 解 。 对 模拟 退火 算法 中 涉及 的 降温 规则 和 热平衡 条 件 做 如 下 规定 。 

O 降温 规则 : 通过 对 7, 乘 以 一 个 接近 1 的 数 "来 减少 Ti 

@ 热平衡 条 件 : 在 每 种 温度 下 ， 转 换 次 数 应 该 等 于 邻 域 的 大 小 ， 
本 算法 中 ,任意 x 与 交换 一 次 作为 邻 域 中 的 一 个 解 ， 故 至 少 应 交换 
CX. 

算法 SAL 

第 1 步 : 由 启发 式 算法 得 初始 解 X。= Gsm. ons x0, WAA 
X, 目标 函数 /(X。)， 并 将 X。 作 为 最 好 解 保存 。 

第 2 步 : 设 定 初始 温度 Tu， 终 止 温度 7, 令 k=0, T, 2 Toe 

第 3 步 : 产生 随机 解 ( 任 意 交换 x,，%) X,，k=k+1， 计算 Af = 
fO) -所 1) 。 

第 4 步 : 如 果 Af<0,， A X, 7 X,, AXo) = 及 贡 ) ， 必 要 时 更 新 最 好 
解 。 转 第 6 步 。 


第 5 步 : 产生 #eU(0，1)， 如 果 exp( - 9) »£ HX, =X, f) = 


T, 
fO). 

第 6 步 : 如 果 k=C?， 则 令 k=0 转 第 7 步 ， 否 则 转 第 3 步 。 

第 7 步 : T, =T, IR T,&T,, 停止 ; 否则 转 第 3 步 。 

第 3 步 交 换 x 与 刀 后 ， 即 使 是 最 佳 顺序 ， 目 标 函 数值 也 可 能 产生 惩 
罚 ， 所 以 每 得 出 一 个 顺序 ， 如 果 Af>0， 先 用 最 速 下 降 法 求 该 顺序 下 的 
近 优 解 ， 得 出 的 结果 作为 X, ， 继 续 后 面 的 步骤 。 

(3) 用 模拟 退火 〈SA2) RERE 

首先 需要 将 连续 问题 离散 化 。 因 为 模拟 退火 方法 适用 于 解决 离散 问 
题 ， 即 自 变量 取 离散 的 点 。 而 半 无 限 规划 是 连续 型 问题 ， 其 自 变量 x e 
[0, T] (i21, 2,…,n)， 所 以 , 在 x 的 邻 域 (x; -6, x, +6) (6<1) 
内 取 离 散 的 点 ， 从 而 将 连续 问题 离散 化 。 即 x; 的 邻 域 为 

N(z,) = ly,ly, 22, -5+257， 
y=0,0.1, 0.2, =, 0.9}, i=1, 2, =, n 
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由 此 得 第 3 阶段 模拟 退火 算法 如 下 : 

算法 SA2 

第 1 步 : 以 SAl 计算 结果 作为 初始 解 X。， 并 作为 最 好 解 保存 ， 计 
4X fO). 

第 2 步 : RET, T, Sk=0, T, 2 Ts. 

第 3 步 : e X, 邻 域内 产生 随机 解 了 = (nu, sons x)", 计算 
Afzf(Y) -f(X,) , ke kl, 

第 4 步 : 与 算法 SAT 的 第 4 步 至 第 7 步 相 同 。 

4. 计算 举例 

考虑 一 个 建筑 公司 收 到 10 个 建造 楼 房 的 订货 ， 主 要 资源 约束 是 人 
力 。 现 有 人 力 水 平 是 100 千 时 / 周 ， 并 预计 以 B=0. 005 的 速率 增加 。 有 
两 个 以 前 计划 中 遗留 的 工作 A 和 B， 对 A， 人 力 需 求 是 200 kh， 它 必须 
在 第 40 周 完成 ， 需 要 20 周 的 加 工时 间 ; 对 B， 人 力 需 求 300 kh， 它 必 
须 在 第 70 周 完成 ， 需 要 40 周 加 工时 间 。 建 筑 周期 ， 人 力 需 求 ， 合 同 价 
He 〈( 即 惩罚 系数 ) 及 对 每 个 订货 顾客 要 求 的 交 货 期 见 表 5. 2。 分 别 利用 
上 面 介绍 的 模拟 退火 算法 和 遗传 算法 进行 计算 ， 两 种 方法 的 运算 结果 在 
表 5.2 的 后 两 列 。 用 遗传 算法 计算 的 目标 函数 值 是 114 779， 用 模拟 退 
火 方法 计算 的 目标 函数 值 是 112 797.6。 对 于 6 个 订货 的 例子 ， 其 订货 
和 计算 结果 见 表 5.3， 用 遗传 算法 求解 的 目标 值 是 15 154 ， 用 模拟 退火 
方法 求解 的 目标 值 是 14 355. 9。 

表 5.2 10 个 订货 的 数据 和 计算 结果 


订货 ”生产 周期 ”资源 需求 ”合同 价格 要 求 交 货 期 生产 完成 时 间 


i L, P, a, d, x, (GA) x, (SA) 
1 20 400 10 25 30.74 32.63 
2 20 900 18 30 20.76 20.43 
3 30 800 12 35 41.88 38.08 
4 40 800 15 40 40.79 42.03 
5 25 1 000 28 40 52. 50 54. 68 
6 20 1200 20 40 86.77 86. 06 
7 50 2 000 30 50 84.38 83.35 
8 10 300 18 15 10. 00 10. 00 
9 20 400 9 50 75.75 42.67 


10 60 1 500 30 60 87.28 90.34 
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5.3 6 个 订货 的 数据 和 计算 结果 
订货 ”生产 周期 ”资源 需求 合同 价格 要 求 交 货 期 生产 完成 时 间 


i L, P, a, d, x, (GA) s, (SA) 
1 20 400 10 25 29.8 28.7 
2 20 900 18 30 20.0 20.0 
3 30 800 12 35 46.0 39.9 
4 40 800 15 40 40.0 52.7 
5 25 1 000 28 40 56.3 57.2 
6 60 1500 30 60 71.9 66.9 
问题 与 思考 


1. 旅行 商 问题 可 简 述 如 下 : 找 一 条 经 过 n 个 城市 的 巡回 〈 每 个 城市 过 且 只 过 
一 次 ) ， 极 小 化 总 的 路 程 。 其 中 ，d 为 城市 与 了 间 的 距离 。 试 按 模拟 退火 算法 设计 
一 个 求解 该 问题 的 算法 〈 包 括 状态 表达 ， 邻 域 定义 ， 算 法 步骤 )， 并 本 出 算法 
框图 。 

2. 工作 指派 问题 可 简 述 如 下 : n 个 工作 可 以 由 nn 个 工人 分 别 完成 。 工 人 i 完成 
工作 j 的 时 间 为 ds。 问 如 何 安 排 可 使 总 的 工作 时 间 达 到 极 小 。 试 按 模拟 退火 算法 设 
计 一 个 求解 该 问题 的 算法 (包括 状态 表达 ， 邻 域 定义 ,算法 步骤 ) ， 并 画 出 程序 
框图 。 
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第 6 章 蚁 群 算法 


蚁 群 算法 是 20 世纪 90 年 代 发 展 起 来 一 种 模仿 蚂蚁 群体 行为 的 新 的 
智能 化 算法 。 该 算法 引入 正 反馈 并 行 机 制 ， 具 有 较 强 的 鲁 棒 性 、 优 良 的 
分 布 式 计 算 机 制 、 易 于 与 其 他 方法 结合 等 优点 。 目 前 蚁 群 算法 已 经 渗透 
到 多 个 应 用 领域 ， 从 一 维 静 态 优化 问题 到 多 维 动态 优化 问题 ， 从 离散 问 
题 到 连续 问题 。 蚁 群 算法 都 展现 出 优异 的 性 能 和 广阔 的 发 展 前 景 ， 成 为 
国内 外 学 者 竞相 关注 的 研究 热点 和 课题 。 本 章 将 系统 地 介绍 蚁 群 算法 的 
理论 、 方 法 和 应 用 ， 基 本 的 蚁 群 算法 ， 包 括 分 析 基本 蚁 群 算法 的 机 制 和 
原理 ， 介 绍 基本 蚁 群 算法 的 数学 模型 、 实 现 方法 ; 介绍 改进 的 蚁 群 算 
法 ， 概 括 性 介绍 蚁 群 算法 收敛 性 研究 的 成 果 ;， 在 分 析 蚁 群 算法 与 其 他 仿 
生 优 化 算法 异同 的 基础 上 ， 介 绍 蚁 群 算法 与 遗传 算法 的 融合 ;最 后 是 蚁 
群 算法 的 典型 应 用 ， 总 结 蚁 群 算法 在 各 个 领域 的 应 用 ， 重 点 介绍 蚁 群 算 
法 在 车 辆 路 径 问题 和 车 间 调度 作业 问题 中 的 应 用 。 


6.1 导 言 


人 类 在 自然 界 获得 启示 ， 发 明了 许多 试图 通过 模拟 自然 生态 系统 机 
制 来 求解 复杂 优化 问题 的 仿生 优化 方法 ， 如 本 书 中 提 到 的 遗传 算法 、 蚁 
群 算法 、 粒 子 群 算法 、 捕 食 搜索 算法 等 。 这 些 与 经 典 的 数学 规划 截然 不 
同 的 仿生 优化 算法 的 相继 出 现 ， 大 大 丰富 了 优化 技术 ， 使 许多 在 人 类 看 
来 高 度 复杂 的 优化 问题 得 到 更 好 的 解决 。 

研究 群居 性 昆虫 行为 的 科学 家 发 现 ， 昆 虫 在 群落 一 级 上 的 合作 基本 
上 是 自 组 织 的 ， 在 许多 场合 中 尽管 这 些 合作 很 简单 ， 但 它们 却 可 以 解决 
许多 复杂 的 问题 。 每 只 蚂蚁 的 智能 并 不 高 ， 看 起 来 没有 集中 的 指挥 , 但 
它们 却 能 协同 工作 寻找 食物 。 据 此 ， 意 大 利 学 者 Dorigo M 等 人 提出 一 
种 模拟 昆虫 王国 中 蚂蚁 群体 更 食 行为 方式 的 仿生 优化 算法 一 一 蚁 群 算法 
(Ant Colony Algorithm，ACA)。 该 算法 引入 正 反馈 并 行 机 制 ， 具 有 较 强 
的 鲁 棒 性 、 优 良 的 分 布 式 计算 机 制 、 易 于 与 其 他 方法 结合 等 优点 。 目 前 
蚁 群 算法 已 经 渗透 到 各 个 应 用 领域 ， 从 一 维 静 态 优化 问题 到 多 维 动态 优 
化 问题 ， 从 离散 问题 到 连续 问题 。 蚁 群 算法 解决 了 许多 复杂 优化 和 经 典 
NP-C 问题 ， 展 现 出 优异 的 性 能 和 广阔 的 发 展 前 景 。 成 为 国内 外 学 者 竞 
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相关 注 的 研究 热点 和 前 沿 性 课题 。 
6.11 蚊 群 更 食 的 特性 


那么 在 自然 界 中 蚂蚁 是 如 何 观 食 的 昵 ? 为 什么 蚁 群 总 能 找到 一 条 从 
蚁 梨 到 食物 源 的 最 短路 径 ? 原来 蚂蚁 会 分 泌 一 种 叫做 信息 素 ( Phero- 
mone) 的 化 学 物质 ， 蚂 蚁 的 许多 行为 受信 息 素 的 调控 ， 蚂 蚊 在 运动 过 
程 中 ， 能 够 在 其 经 过 的 路 径 上 留 下 信息 素 ， 而 且 能 感知 这 种 物质 的 存在 
及 其 浓度 ， 以 此 指导 自己 的 运动 方向 。 蚂 蚁 倾向 于 朝 着 信息 素 浓度 高 的 
方向 移动 。 

EPI, SUE A 点 ， 蚁 群发 现 食物 源 在 D 点 ， 它 们 总 是 会 选 
择 最 短 的 直线 路 径 AD 来 搬运 食物 ， 如 图 6. 1(a) 所 示 。 如 果 搬运 路 线 
上 突然 出 现 障碍 物 ， 不 管 路 径 长 短 ， 蚂 蚁 按 相 同 的 概率 选择 在 图 中 B 
点 C 点 绕 过 障碍 物 ， 如 图 6. 1(b) 所 示 。 由 于 路 径 ABD 的 长 度 小 于 路 径 
ACD 的 长 度 ， 单 位 时 间 内 通过 路 径 ABD 的 蚂蚁 数量 大 于 通过 路 径 ACD 
的 蚂蚁 数量 ， 则 在 路 径 ABD 上 面 遗 留 的 信息 素 浓度 比较 高 ， 因 为 蚂蚁 
倾向 于 朝 着 信息 素 浓度 高 的 方向 移动 ， 所 以 选择 路 径 ABD 的 蚂蚁 随 之 
增多 ， 如 图 6. 1(e) 所 示 。 于 是 ， 蚁 群 的 集体 行为 表现 出 一 种 信息 正 反 
馈 现 象 ， 即 最 短路 径 上 走 过 的 蚂蚁 越 多 ， 则 后 来 的 蚂蚁 选择 该 路 径 的 概 
率 就 越 大 ， 蚂 蚁 个 体 之 间 就 是 通过 这 种 信息 的 交流 达到 寻找 食物 和 蚁 穴 
之 间 最 短路 径 的 目的 ， 如 图 6. 1(d) 所 示 。 


B 
SR y. RAT 食物 源 aX 食物 源 
A 7” D A E D 
障碍 
c 


(a) (b) 


食物 源 
D 


图 6.1 蚁 群 寻找 食物 过 程 
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6.1.2 人 工 蚂 蚁 与 真实 蚂蚁 的 异同 


蚁 群 算法 是 利用 蚁 群 现 食 的 群体 智能 解决 复杂 优化 问题 的 典型 例 
子 。 为 了 使 蚊 群 算法 有 令 人 满意 的 性 能 ， 要 在 真实 的 蚁 群 基础 上 继承 些 
什么 ， 握 弃 些 什么 ? 下 面 看 一 看 人 工 蚂蚁 与 真实 蚂蚁 的 异同 。 

1. 相同 点 

(1) 两 个 群体 中 都 存在 个 体 相 互 交流 的 通信 和 机制。 真实 蚂蚁 在 经 
过 的 路 径 上 留 下 信息 素 ， 用 以 影响 蚊 群 中 的 其 他 个 体 。 且 信息 素 随 着 时 
间 推 移 逐 渐 挥发 ， 减 小 历史 遗留 信息 对 蚁 群 的 影响 。 同 样 ， 人 工 蚂 蚁 改 
变 其 所 经 过 路 径 上 存储 的 数字 化 信息 素 ， 该 信息 素 记 录 了 人 工 蚂蚁 当前 
解 和 历史 解 的 性 能 状态 ， 而 且 可 被 后 继 人 工 蚂蚁 读 写 。 数 字 化 的 信息 素 
同样 具有 挥发 特性 ， 它 像 真实 的 信息 量 挥发 一 样 使 人 工 蚂蚁 逐渐 忘却 历 
史 遗 留 信息 ， 在 选择 路 径 时 不 局 限于 以 前 人 工 蚂蚁 所 存留 的 经 验 。 

(2) 都 要 完成 寻找 最 短路 径 的 任务 。 真 实 蚂 蚁 要 寻找 一 条 从 巢穴 
到 食物 源 的 最 短路 径 。 人 工 蚂蚁 要 寻找 一 条 从 源 节点 到 目的 节点 间 的 最 
短路 径 。 两 种 蚂蚁 都 只 能 在 相 邻 节点 间 一 步 步 移动 ， 直 至 遍历 完 所 有 
节点 。 

(3) 都 采用 根据 当前 信息 进行 路 径 选择 的 随机 选择 策略 。 真 实 蚂 
蚁 和 人 工 蚂蚁 从 某 一 节点 到 下 一 节点 的 移动 都 是 利用 概率 选择 策略 实现 
的 。 这 里 概率 选择 策略 是 基于 当前 信息 来 预测 未 来 情况 的 一 种 方法 。 

2. 不 同 点 

(1) 人 工 蚂蚁 具有 记忆 能 力 ， 而 真实 蚂蚁 没有 。 人 工 蚂 蚁 可 以 记 
住 曾经 走 过 的 路 径 或 访问 过 的 节点 ， 可 提高 算法 的 效率 。 

(2) 人 工 蚂 蚁 选择 路 径 的 时 候 并 不 是 完全 盲目 的 ， 受 到 问题 空间 
特征 的 启发 ， 按 一 定 算法 规律 有 意识 地 寻找 最 短路 径 (如 在 旅行 商 问 
题 中 ， 可 以 预先 知道 下 一 个 目标 的 距离 ) 。 

(3) 人 工 蚂 蚁 生活 在 离散 时 间 的 环境 中 ， 即 问题 的 求解 规划 空间 
是 离散 的 ， 而 真实 蚂 蚊 生活 在 连续 时 间 的 环境 中 。 


6.1.3. 蚊 群 算法 的 研究 进展 


1991 年 ， 意 大 利 学 者 Dorigo M 等 人 在 法 国 巴黎 召开 的 第 一 届 欧 洲 
人 工 生命 会 议 (European Conference on Artificial Life, ECAL) 上 首次 提 
出 了 蚊 群 算法 ， 之 后 的 5 年 中 并 没有 受到 国际 学 术 界 的 广泛 关注 。1996 
年 ，Dorigo M 等 人 在 《IEEE Transactions on Systems，Man，and Cyber- 
netics-Part B》 上 发 表 了 “Ant system: optimization by a colony of coopera- 
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ting agents” 一 文 ， 莫 定 了 蚁 群 算法 的 基础 。 在 这 之 后 的 5 年 里 ， 蚁 群 
算法 逐渐 引起 了 国际 学 术 界 的 广泛 关注 。1998 年 ，Dorigo M 组 织 在 比 
利 时 布鲁塞尔 召开 了 第 一 届 蚁 群 算法 国际 研讨 会 (ANTS”98 ) ， 随 后 
每 隔 两 年 都 要 在 布鲁塞尔 召开 一 次 蚁 群 算法 国际 研讨 会 。2000 4E, Gut- 
jahr W J 发 表 了 题 为 “A graph-based ant system and its convergence” 的 学 
术 论 文 ， 对 蚁 群 算法 的 收敛 性 进行 了 证 明 。 同 年 ，Dorigo M 和 Bonabeau 
等 在 国际 顶级 学 术 杂 志 《Nature》 上 发 表 了 蚁 群 算法 研究 综述 ,将 这 
一 研究 推 向 国际 学 术 界 的 前 沿 。 

最 近 几 年 ， 国 际 顶 级 学 术 杂 志 《Nature》 曾 多 次 对 蚁 群 算法 的 研究 
成 果 进 行 报道 ，《Future Generation Computer Systems) (Vol. 16，No. 8) 
和 《IEEE Transactions on Evolutionary Computation) (Vol.6, No.4) 分 
别 于 2000 年 和 2002 年 出 版 了 蚁 群 算法 特刊 。 

我 国 对 蚁 群 算法 的 研究 起 步 较 晚 ， 从 公开 发 表 论 文 的 时 间 来 看 ， 国 
内 最 先 研究 蚁 群 算法 的 是 东北 大 学 的 张 纪 会 和 人 徐 心 和 。 和 尔后， 高尚 、 汪 
镭 、 李 艳 君 、 段 海滨 、 陈 峻 、 张 勇 德 和 杨 勇 等 都 有 不 俗 的 工作 。 段 海滨 
的 著作 《 蚁 群 算法 原理 及 其 应 用 》 则 为 国内 第 一 本 系统 介绍 研究 蚁 群 
算法 的 学 术 著作 ， 参 见 参考 文献 [20] 。 目 前 ， 蚁 群 算法 的 研究 已 经 由 
单一 的 TSP 领域 渗透 到 多 个 应 用 领域 。 从 一 维 静 态 优化 问题 到 多 维 动 
态 优化 问题 ， 从 离散 问题 到 连续 问题 。 同 时 蚁 群 算法 在 模型 改进 及 与 其 
他 仿生 优化 算法 的 融合 方面 也 取得 了 相当 丰富 的 研究 成 果 ， 展 现 出 广阔 
的 发 展 前 景 。 


6.2 ”基本 蚁 群 算法 


这 一 节 首 先 从 深层 上 对 基本 蚁 群 算法 的 机 理 进行 研究 ， 从 TSP 的 
角度 对 基本 蚁 群 算法 的 数学 模型 进行 分 析 ， 并 给 出 具体 实现 步骤 和 程序 
结构 框架 。 然 后 在 引入 复杂 度 概念 的 基础 上 ， 对 基本 蚁 群 算法 进行 复杂 
度 分 析 。 最 后 讨论 参数 选择 对 蚁 群 算法 性 能 的 影响 。 这 节 内 容 是 蚁 群 算 
法 的 理论 分 析 部 分 ， 也 是 深入 理解 蚁 群 算法 、 改 进 蚁 群 算法 、 应 用 蚁 群 
算法 的 基础 。 


6.2.1 基本 蚁 群 算法 的 原理 


基本 蚁 群 算法 (Ant System, AS) 是 采用 人 工 蚂蚁 的 行走 路 线 来 表 
示 待 求解 问题 可 行 解 的 一 种 方法 。 每 只 人 工 蚂蚁 在 解 空间 中 独立 地 搜索 
可 行 解 ， 当 它们 碰 到 一 个 还 没有 走 过 的 路 口 时 ， 就 随机 挑选 一 条 路 径 前 
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行 ， 同 时 释放 出 与 路 径 长 度 有 关 的 信息 素 。 路 径 越 短 信息 素 的 浓度 就 越 
大 。 当 后 继 的 人 工 蚂蚁 再 次 碰 到 这 个 路 口 的 时 候 ， 以 相对 较 大 的 概率 选 
择 信息 素 较 多 的 路 径 ， 并 在 “行走 路 线 ” 上 留 下 更 多 的 信息 素 ， 影 响 
后 来 的 蚂蚁 ， 形 成 正 反馈 机 制 。 随 着 算法 的 推进 ， 代 表 最 优 解 路 线 上 的 
信息 素 逐 渐 增多 ， 选 择 它 的 蚂 蚊 也 逐渐 增多 ， 其 他 路 径 上 的 信息 素 却 会 
随 着 时 间 的 流逝 而 逐渐 消减 ， 最 终 整个 蚁 群 在 正 反馈 的 作用 下 集中 到 代 
表 最 优 解 的 路 线 上 ， 也 就 找到 了 最 优 解 。 在 整个 寻 优 过 程 中 ， 单 只 蚂蚁 
的 选择 能 力 有 限 ， 但 蚁 群 具有 高 度 的 自 组 织 性 ， 通 过 信息 素 交换 路 径 信 
息 ， 形 成 集体 自 催化 行为 ， 找 到 最 优 路 径 。 图 6. 2 是 一 个 基于 蚁 群 算法 
的 人 工 蚁 群 系统 寻找 最 短路 径 的 例子 。 

如 图 6.2(a) 所 示 ， 路 径 BF，CF fü BEC 的 路 程 长 度 d 为 1,E 是 路 
径 BEC 的 中 点 。 假 设 在 每 个 单位 时 间 内 有 30 只 蚂蚁 从 A 来 到 B，30 只 
蚂蚁 从 D 来 到 C， 每 只 蚂蚁 单位 时 间 内 行进 路 程 为 1， 蚂蚁 在 行进 过 程 
中 在 单位 时 间 内 留 下 1 个 浓度 单位 的 信息 素 ， 在 一 个 时 间 段 (t, 4+1) 
结束 后 瞬间 完全 挥发 。 

如 图 6.2(b) 所 示 , t=0 时 ,在 B 和 C 点 各 有 30 只 蚂蚁 , 由 于 此 前 
路 径 上 没有 信息 素 ， 它 们 随机 地 选择 路 径 , 在 BF, BE, CF 和 CE 上 各 
有 15 只 蚂蚁 。 

如 图 6.2(c) 所 示 , t=1 时 ,又 有 30 只 蚂蚁 到 达 B。 它 们 发 现在 BF 
上 的 信息 素 浓度 为 15，BE 上 信息 素 浓 度 为 30 (是 由 15 只 BE 走向 和 
15 只 EB 走向 的 蚂蚁 共同 留 下 的 )， 因 此 选择 BE 路 径 的 蚂蚁 数 的 期 望 
值 是 选择 BF 蚂蚁 数 的 2 倍 。 所 以 ，20 只 蚂蚁 选择 BE，10 只 蚂蚁 选择 
BF。 同 样 的 情况 发 生 在 C 点 。 这 个 过 程 一 直 持续 下 去 ， 直 到 所 有 人 工 
蚂蚁 最 终 选 择 最 短路 径 BEC. (或 CEB). 


| 
d-0.5 15 只 _ -一 CI5 只 10 只 _-zC~、20 只 
P ao , LU f > 
F. 
OM as Sn LZ Su LZ 
| [los hon 
A A A 
(a) 人 工 蚁 群 搜索 环境 (5):-0 时 刻 人 工 蚁 群 搜索 情况 (©) 1 时 刻 人 工 蚁 群 搜索 情况 


图 6.2 ”人工 蚁 群 路 径 搜索 实例 
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6.2.2 基本 蚊 群 算法 的 数学 模型 


很 多 文献 对 基本 蚁 群 算法 的 详细 介绍 都 是 从 旅行 商 问题 ( Traveling 
Salesman Problem ,简称 TSP) 开始 。 这 是 因为 蚁 群 现 食 的 过 程 与 TSP 
问题 的 求解 非常 相似 ， 为 了 便于 读者 更 好 地 理解 蚁 群 算法 的 数学 模型 和 
实现 过 程 ， 以 n 个 城市 TSP 问题 作为 背景 介绍 基本 蚁 群 算法 。TSP 问题 
属于 一 种 典型 的 组 合 优化 问题 ， 是 组 合 优化 问题 中 最 经 典 的 NP 难题 之 
一 ， 它 在 蚁 群 优化 算法 的 发 展 过 程 中 起 着 非常 重要 的 作用 。 

TSP 问题 给 定 n 个 城市 的 集合 C= ia. 6. c. cl 及 城市 之 
间 旅 行路 径 的 长 短 dj(1<i<n，1<j<n，ij) 。TSP 问题 是 找到 一 条 
只 经 过 每 个 城市 一 次 且 回 到 起 点 的 、 最 短路 径 的 回路 。 设 城市 i 和 j 之 
闻 的 距离 为 di ， 表 示 如 式 (6.1) MR: 

dy=[ (5) + (yx) Y (6.1) 

TSP 求 解 中 ， 假 设 蚁 群 算法 中 的 每 只 蚂蚁 是 具有 下 列 特征 的 简单 智 
能 体 。 

QD 每 次 周游 ， 每 只 蚂蚁 在 其 经 过 的 支 路 (i, j) 上 都 留 下 信息 素 。 

Q) 蚂蚁 选择 城市 的 概率 与 城市 之 间 的 距离 和 当前 连接 支 路 上 所 包 
含 的 信息 素 余 量 有 关 。 

图 为 了 强制 蚂蚁 进行 合法 的 周游 ， 直 到 一 次 周游 完成 后 ， 才 允许 
蚂蚁 游 走 已 访问 过 的 城市 (这 可 由 禁忌 表 来 控制 ) 。 

蚁 群 算法 中 的 基本 变量 和 常数 有 : m， 蚁 群 中 蚂蚁 的 总 数 ; n, TSP 
问题 中 城市 的 个 数 ; d,， 城 市 i 和 j 之 间 的 距离 ， 其 中 i, je (0, n); 
Ti(t) ， 表 示 上 时 刻 在 路 径 C, j) 连 线 上 残留 的 信息 量 。 在 初始 时 刻 各 
条 路 径 上 信息 量 相等 ， 并 设 ri(0) = const( const 为 常数 ) o 

蚂蚁 上 (k=1, 2, =, m) 在 运动 过 程 中 ， 根 据 各 条 路 径 上 的 信 
息 量 决定 其 转移 方向 。ps (1) 表示 在 1 时 刻 蚂 蚁 上 由 城市 i 转移 到 城市 j 
的 状态 转移 概率 ， 根 据 各 条 路 径 上 残留 的 信息 量 7,(:) 及 路 径 的 启发 
信息 7, 来 计算 的 ， 如 式 (6.2) 所 示 。 表 示 蚂 蚁 在 选择 路 径 时 会 尽量 选择 
离 自己 距离 较 近 且 信 息 素 浓度 较 大 的 方向 。 

[OO ]* + EC * 


e UU, je allowed, 
pO =l 2E OY c UO Y (6.2) 
0, 其 他 
RH, allowed, = |C- tabu) 一 一 表示 在 上 时 刻 蚂蚁 上 下 一 步 允许 选择 


的 城市 〈 即 还 没有 访问 的 城市 ) ; 
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tabu,(k=1, 2, =, m) 
的 城市 ; 

a 一 一 表示 信息 启发 式 因子 ， 反映 了 蚁 群 在 运动 过 程 中 所 残留 的 信 
息 量 的 相对 重要 程度 ; 

B 一 一 表示 期 望 启发 式 因子 ， 反 应 了 期 望 值 的 相对 重要 程度 ; 

一 一 表示 由 城市 i 转移 到 城市 j 的 期 望 程度 ， 被 称 为 先 验 知识 ， 
这 一 信息 可 由 要 解决 的 问题 给 出 ， 并 由 一 定 的 算法 来 实现 ，TSP 问题 中 
一 般 取 值 为 式 (6. 3)。 


表示 禁忌 表 ， 记 录 蚂 蚁 & 当前 已 走 过 


q,C =} (6.3) 


对 蚂蚁 而 言 ，d, 越 小 ， 则 y(t) RK, p) 也 就 越 大 。 
为 了 避免 残留 信息 素 过 多 而 淹没 启发 信息 ， 在 每 只 蚂蚁 走 完 一 步 或 
者 完成 对 所 有 n 个 城市 的 遍历 后 ， 要 对 残留 信息 素 进 行 更 新 处 理 。(t+ 
n) 时 刻 在 路 径 (i, j) 上 信息 量 可 按 式 (6.4) 和 式 (6.5) 所 示 的 规 
则 进行 调整 。 
Ti(t+n) =(1-p) .ri(D & Ar (6.4) 
Ar,(t) = = Ari (t) (6.5) 


式 中 ,po 一 一 表示 信息 素 挥发 系数 。 模 仿 人 类 记忆 特点 ， 旧 的 信息 将 逐 
步 忘却 、 肖 弱 。 为 了 防止 信息 的 无 限 积累 ，p 的 取 值 范围 为 [0，1) ， 
用 1 -p 表示 信息 的 残留 系数 。 
Ar) 一 一 表示 本 次 循环 中 路 径 (i,j) EMR RR, We 
AYA) Ary(t) =0。 
Ar$(1) 一 一 表示 第 只 蚂蚁 在 本 次 循环 中 留 在 路 径 (i, j) 上 的 信 
息 量 。 
根据 信息 素 更 新 策略 的 不 同 ，Dorigo M 提出 了 三 种 不 同 的 基本 蚁 群 
算法 模型 ， 分 别称 之 为 蚁 周 模型 〈 Ant-Cycle Model) ， 蚁 量 模型 CAnt- 
Quantity Model) 及 蚊 密 模 型 (Ant-Density Model), 三 种 模型 的 差别 在 
于 Ar%(t) 求法 不 同 ， 下 面 比较 三 种 模型 的 异同 。 
蚁 周 模型 (Ant-Cycle Model) 
Q FER 
An) = LS 第 上 只 蚂蚁 在 本 次 循环 中 经 过 (i) (6.6) 
0, 其 他 
蚁 量 模型 (Ant-Quantity Model) 
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L, 第 上 只 蚂蚁 在 和 ++1 之 间 经 过 (i,j) 
o, 其 他 
蚁 密 模 型 (Ant-Density Model) 

ao BERERE MZAA) 
Ant = 人 x 
式 中 ，0-- 一 常量 ， 表 示 蚂 蚁 循环 一 周 或 一 个 过 程 在 经 过 的 路 径 上 所 释 
放 的 信息 素 总 量 ， 它 在 一 定 程度 上 影响 算法 的 收敛 速度 ; 

已 一 一 表示 第 上 只 妈 蚊 在 本 次 循环 中 所 走路 径 的 总 长 度 。 

区 别 : 式 (6.6) 利 用 整体 信息 ， 蚂 蚁 完成 一 个 循环 后 才 更 新 所 有 路 
径 上 的 信息 素 ; 式 (6.7) 和 式 (6.8) 利用 局 部 信息 ， 蚂 六 每 走 一 步 就 要 
更 新 路 径 上 的 信息 素 ; 式 (6.6) 蚊 周 模型 在 求解 TSP 问题 时 效果 较 好 ， 
应 用 也 比较 广泛 。 


6.2.3 基本 蚊 群 算法 的 具体 实现 


这 里 的 基本 蚁 群 算法 是 基于 蚁 周 模型 (Ant-Cycle Model) 的 ,实现 
步骤 为 

第 1 步 : 初始 化 参数 。 时 间 = 0, 循 环 次 数 N。 = 0, 设置 最 大 循环 次 
MCN mo PIRE CL) 的 初始 化 信息 量 rv(t) = const, 初 始 时 刻 Ary(0) =0。 

第 2 步 : 将 m 只 蚂蚁 随机 放 在 个 城市 上 。 

第 3 步 : 循环 次 数 NN + 1。 

第 4 步 : 令 蚂蚁 禁忌 表 索 引号 上 = 1。 

第 5 步 : k=k+1。 

第 6 步 : 根据 状态 转移 概率 公式 (6.2) 计 算 蚂 蚁 选择 城市 7 的 概率 ， 
je {C-tabu,}. 

第 7 步 : 选择 具有 最 大 状态 转移 概率 的 城市 ， 将 蚂蚁 移动 到 该 城 
市 ， 并 把 该 城市 记 入 禁忌 表 中 。 

第 8 步 : 车 没有 访问 完 集合 C 中 的 所 有 城市 ， 即 <m， 跳 转 至 第 
5 步 ; 否则 ， 转 第 9 步 。 

第 9 步 : 根据 式 (6.4) 和 式 (6.5) 更 新 每 条 路 径 上 的 信息 量 。 

第 10 步 : 若 满足 结束 条 件 ， 循 环 结束 输出 计算 结果 ; 否则 清空 禁 
忌 表 并 跳 转 到 第 3 步 。 

基本 蚁 群 算法 的 算法 框图 如 图 6. 3 所 示 。 


| (6.7) 


(6.8) 
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参数 初始 化 ，N.=0 


N 
按照 式 (6.4) 和 式 (6.5) 更 新 每 条 路 径 上 的 信息 量 


满足 结束 条 件 ? 


Y 
输出 程序 计算 结果 


图 6.3 基本 蚊 群 算法 的 算法 框图 
6.2.4 基本 蚊 群 算法 的 复杂 度 分 析 


每 个 组 合 优化 问题 都 可 以 通过 枚 举 的 方法 求 得 最 优 解 ， 枚 举 是 以 时 
间 为 代价 的 ， 即 使 是 在 计算 机 软 硬 件 技术 高 速 发 展 的 今天 ， 满 足 大 规模 
问题 求解 所 要 求 的 计算 时 间 和 存储 空间 仍然 是 非常 棘手 的 问题 ， 造 成 一 
些 问题 理论 可 解 而 在 实际 中 不 一 定 可 解 。 如 TSP 问题 采用 穷 举 法 ， 所 


有 的 可 行路 径 共有 人 5) 条 ， 若 以 路 径 比较 为 基本 操作 ， 则 需要 


C21 -1 次 比较 才能 获得 最 优 解 。 如 果 以 计算 机 1 s 可 以 完成 24 个 


城市 所 有 路 径 的 枚 举 为 单位 ， 则 25 个 城市 的 枚 举 需要 24 s。 类 似 地 ， 
城市 数 与 计算 时 间 的 关系 见 表 6. 1。 当 城市 数目 增加 到 30 个 时 ， 计 算 
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时 间 约 10.8 年 , 已 经 超出 可 接受 的 范围 。 
表 6.1 TSP 问题 枚 举 计算 的 城市 数 与 计算 时 间 的 关系 


城市 数 | 24 as | 2% | a | 2 | » ET 


计算 时 间 | 1s 24 s | 10 min 43h | 约 49d| 136.54 约 10.8 y] 29 325 y 


鉴于 许多 问题 的 求解 复杂 度 可 能 大 于 TSP 问题 ， 因 此 只 有 了 解 所 
研究 问题 和 算法 的 复杂 度 ， 才 能 有 针对 性 地 设计 和 改进 算法 ， 提 高 算法 
的 优化 效率 。 

1. 复杂 度 的 基本 概念 

基本 蚁 群 算法 的 复杂 度 分 析 是 在 理论 上 对 蚁 群 算法 的 算法 效率 的 分 
析 。 可 分 为 算法 的 时 间 复 杂 度 分 析 和 空间 复杂 度 分 析 。 

定义 6.1 (算法 的 时 间 复 杂 度 ) : 指 求解 该 问题 的 所 有 算法 中 时 间 
复杂 性 最 小 的 算法 时 间 复 杂 度 。 

在 实际 中 ,衡量 一 个 算法 的 好 坏 通常 是 用 算法 中 所 使 用 的 加 、 减 、 
乘 、 除 和 比较 等 基本 运算 的 总 次 数 以 及 具体 的 问题 在 计算 机 计算 时 的 二 
进 制 输入 数据 的 大 小 关系 来 度量 。 由 于 对 一 个 问题 的 二 进 制 输入 长 度 和 
算法 的 基本 计算 总 次 数 是 粗略 估计 的 ， 一 般 总 是 给 出 一 个 上 限 。 

定义 6.2 (算法 的 空间 复杂 度 ) : 指 求解 该 问题 的 所 有 算法 中 空间 
复杂 性 最 小 的 算法 空间 复杂 度 。 

在 实际 中 ， 通 常 把 算法 执行 时 间 内 所 占用 的 存储 单元 定义 为 算法 的 
空间 复杂 度 。 由 于 基本 蚁 群 算法 的 空间 复杂 度 非常 简单 ， 不 做 单独 讨 
论 ， 详 见 文献 [20] 。 

下 面 分 析 基 本 蚁 群 算法 的 时 间 复 杂 度 。 首 先 定义 数量 级 的 概念 。 

定义 6.3 (数量 级 ) : 给 定 自然 数 n 的 两 个 函数 F(n) 和 CGC(n)， 当 且 
仅 当 存 在 一 个 正常 数 K FI e ny, EM nz n BY, A F(n) &KGQn), 
则 称 函 数 F(n) 以 函数 C(n) 为 界 ， 记 作 F(n) 20(G(n)), RE FC) 
是 0(C(n) )。 此 处 的 “0” 表 示 数 量 级 的 概念 。 

基本 蚊 群 算法 的 问题 规模 可 表示 为 ”的 函数 ， 其 中 时 间 复 杂 度 记 为 
T(n) 。 

2. 基本 蚊 群 算法 的 时 间 复 杂 度 分 析 

对 于 文中 的 基本 蚊 群 算法 ，n 为 TSP 的 规模 ，m 为 人 工 蚂蚁 数量 ， 
N 为 算法 的 循环 次 数 ， 从 蚁 周 模型 的 实现 过 程 可 以 看 到 该 算法 各 环节 
的 时 间 复 杂 度 ， 见 表 6.2。 
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表 6.2 基本 蚊 群 算法 时 间 复 杂 度 分 析 表 
Step 内 容 T(n) 


初始 化 9 m) 
set t = 0iset N, = 0;//t 为 时 间 计数 器 ,N. 为 循环 计数 器 
set ri(t) = const,Ar, = 0,// 设置 信息 素 初 值 

将 m 个 蚂蚁 随机 置 于 个 节点 上 


UET iE 

设置 蚂蚁 禁忌 表 

set s = 0;//s 为 禁忌 表 指针 
fork=1tomdo 


置 第 上 只 蚂蚁 的 起 始 城市 到 禁忌 表 tabu, (s) 


O(m) 


每 只 蚂蚁 单独 构造 解 O(nmm) 
循环 计算 直到 禁忌 表 满 // 共 需 循环 (n - 1) 次 
sets 2 5l; 
fork = 1 to m do 
根据 转移 概率 ps(+) 选择 下 一 城市 


将 城市 序号 了 加 入 禁 鼠 表 tabu, (s) 
i 


解 的 评价 和 轨迹 更 新 量 的 计算 O(n'm) 
fork = 1 to m do 
将 第 上 只 蚂蚁 从 禁忌 表 tabu, (n) 移 到 tabu, (1) 
计算 第 上 只 蚂蚁 在 本 次 循环 中 的 路 径 长 度 
更 新 最 优 路 径 
计算 各 条 路 径 上 的 信息 素 反 馈 量 Ary 


信息 素 轨迹 浓度 的 更 新 O(n*) 
5 计算 各 条 路 径 上 在 下 一 轮 循环 开始 前 的 信息 素 强度 Ti(t+m) 


sett =t+nsset N, = N, +1 


判定 是 否 达 到 终止 条 件 Co 


WEN, < N.。., 且 搜索 没有 出 现 停止 现象 
清空 全 部 禁忌 表 

6 返回 step2 

否则 
打印 最 短路 径 

结束 


—— 1. 
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Dorigo 等 曾 对 经 典 的 TSP 问题 求解 复杂 度 进行 了 深入 研究 ， 所 得 到 
的 结果 表明 ， 算法 的 时 间 复 杂 度 为 7(n) = O(N, + n +m); 当 参 与 搜索 
的 蚂蚁 个 数 m 大 致 与 问题 规模 n 相等 时 ,算法 的 时 间 复 杂 度 为 
T(n) =O(N, + n°), 


6.2.5 参数 选择 对 蚊 群 算法 性 能 的 影响 


探索 (Exploration) 和 开发 (Exploitation) 能 力 的 平衡 是 影响 算法 
性 能 的 一 个 重要 方面 ， 也 是 蚁 群 算法 研究 的 关键 问题 之 一 。 探 索 能 力 是 
指 蚁 群 算法 要 在 解 空间 中 测试 不 同 区 域 以 找到 一 个 局 优 解 的 能 力 ; 开发 
能 力 是 指 蚁 群 算法 在 一 个 有 希望 的 区 域内 进行 精确 搜索 的 能 力 。 那 么 该 
如 何 设 定 蚁 群 算法 中 的 各 种 参数 ， 实 现 探索 和 开发 能 力 的 平衡 呢 ? 这 
里 ， 探 索 与 开发 实际 上 就 是 前 面 章节 所 说 的 全 局 搜索 能 力 和 局 域 搜索 
能 力 。 

由 于 蚁 群 算法 参数 空间 的 庞大 性 和 各 参数 之 间 的 关联 性 ， 很 难 确定 
最 优 组 合 参数 使 蚁 群 算法 求解 性 能 最 佳 ， 至 今 还 没有 完善 的 理论 依据 。 
大 多 数 情况 下 是 通过 试验 的 反复 试 次 得 到 的 。 目 前 已 经 公布 的 蚁 群 算法 
参数 设置 成 果 都 是 就 特定 问题 所 采用 的 特定 蚁 群 算法 而 言 ， 以 应 用 最 多 
的 蚁 周 模型 (Ant-Cycle) 为 例 ， 其 最 好 的 试验 结果 为 

0<a<5, 0<p<5, 0.1<p<0.99, 10<0<10 000 
那么 到 底 有 没有 确定 最 优 组 合 参数 的 一 般 方法 呢 ? 为 了 回答 这 个 问题 ， 
先 分 析 以 下 参数 对 蚁 群 算法 性 能 的 影响 。 

(1) 信息 素 和 启发 函数 对 蚁 群 算法 性 能 的 影响 

信息 素 r, 是 表征 过 去 信息 的 载体 ， 而 启发 函数 m; 则 是 表征 未 来 信 
息 的 载体 ， 它 们 直接 影响 到 蚁 群 算法 的 全 局 收敛 性 和 求解 效率 。 

(2) 信息 素 残 留 因子 对 蚁 群 算法 性 能 的 影响 

参数 p 表示 信息 素 挥发 因子 ， 其 大 小 直接 关系 到 蚁 群 算法 的 全 局 搜 
索 能 力 及 其 收敛 速度 ; 参数 1 -p 表示 信息 素 残留 因子 ， 反 映 了 蚂蚁 个 
体 之 间 相 互 影 响 的 强 弱 。 信 息 素 残 留 因 子 1 -p 的 大 小 对 蚁 群 算法 的 收 
敛 性 能 影响 非常 大 。 在 0. 1 ~ 0. 99 范围 内 ，1 -p 与 迭代 次 数 N, 近似 成 
正比 ， 这 是 由 于 1 -p 很 大 ， 路 径 上 的 残留 信息 占 主导 地 位 ， 信 息 正 反 
馈 作用 相对 较 弱 ， 搜 索 的 随机 性 增强 ， 因 而 蚁 群 算法 的 收敛 速度 很 慢 。 
车 1-p 较 小 时 ， 正 反馈 作用 占 主导 地 位 ， 搜 索 的 随机 性 减弱 ， 导 致 收 
敛 速度 快 ， 但 易于 陷于 局 优 状 态 。 

(3) 蚂蚁 数目 对 蚁 群 算法 性 能 的 影响 

蚁 群 算法 是 通过 多 个 候选 解 组 成 的 群体 进化 过 程 来 搜索 最 优 解 ， 所 
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以 蚂蚁 的 数目 m 对 蚁 群 算法 有 一 定 影响 。 蚂 蚁 数量 m 大 (相对 处 理 问 
题 的 规模 ) ， 会 提高 蚁 群 算法 的 全 局 搜索 能 力 和 稳定 性 ， 但 数量 过 大 会 
导致 大 量 曾 被 搜索 过 的 路 径 上 的 信息 量变 化 趋 于 平均 ， 信 息 正 反馈 作用 
减弱 ， 随 机 性 增强 ， 收 敛 速度 减 慢 。 反 之 ， 蚂 蚁 数量 m 小 (相对 处 理 
问题 的 规模 ) ， 会 使 从 来 未 被 搜索 到 的 解 上 的 信息 量 减 小 到 接近 于 0 
全 局 搜索 的 随机 性 减弱 ， 虽 然 收敛 速 度 加 快 ， 但 会 使 算法 的 稳定 性 变 
差 ， 出 现 过 早 停滞 现象 。 经 大 量 的 仿真 试验 获得 : 当 城 市 规模 大 致 是 蚂 
蚁 数目 的 1.5 倍 时 ， 蚁 群 算法 的 全 局 收敛 性 和 收敛 速度 都 比较 好 。 

(4) 启发 式 因子 、 期 望 启发 式 因子 、 信 息 素 强度 对 蚁 群 算法 性 能 
的 影响 

启发 式 因子 a 反映 蚂蚁 在 运动 过 程 中 所 积累 的 信息 量 在 指导 蚁 群 
搜索 中 的 相对 重要 程度 。a 越 大 ， 蚂 蚁 选择 以 前 走 过 路 径 的 可 能 性 就 越 
大 ， 搜 索 的 随机 性 减弱 ; a 越 小 ， 易 使 蚁 群 算法 过 早 陷 人 局 优 。 

期 望 启发 式 因子 B 反映 了 启发 式 信息 在 指导 蚊 群 搜索 过 程 中 的 相对 
重要 程度 ， 这 些 启发 式 信息 表现 为 寻 优 过 程 中 先 验 性 、 确 定性 因素 。B 
越 大 ， 蚂 蚁 在 局 部 点 上 选择 局 部 最 短路 径 的 可 能 性 越 大 ， 虽 然 加 快 了 收 
剑 速 度 ， 但 减弱 了 随机 性 ， 易 于 陷 人 局 部 最 优 。 

信息 素 强度 Q 为 蚂蚁 循环 一 周 时 释放 在 所 经 路 径 上 的 信息 素 总 量 。 
@ 越 大 ， 蚂 蚁 在 已 遍历 路 径 上 信息 素 的 累积 越 快 ， 加 强 蚁 群 搜索 时 的 正 
反馈 性 ， 有 助 于 算法 的 快速 收敛 。 

基于 以 上 各 种 参数 对 算法 收敛 性 的 影响 ， 段 海滨 提出 了 设 定 蚁 群 算 
法 参数 “三 步 走 ” 的 思想 (参见 文献 [20] ) 。 其 步骤 如 下 : 

第 1 步 : 确定 蚂蚁 数目 ， 确 定 原则 : 城市 规模 /蚂蚁 数目 =1.5。 

第 2 步 : 参数 粗 调 ， 调 整 取 值 范围 较 大 的 信息 启发 式 因子 a、 期 望 
启发 式 因子 B 以 及 信息 素 强度 0 等 参数 ， 以 得 到 较 理想 的 解 。 

第 3 步 : 参数 微调 ， 调 整 取 值 范围 较 小 的 信息 素 挥 发 因子 po 


6.3 改进 的 蚁 群 算法 


虽然 与 已 经 发 展 完备 的 一 些 启发 式 算法 比较 起 来 ， 基 本 蚁 群 算法 的 
计算 量 比较 大 ， 搜 索 时 间 长 ， 但 在 解决 某 些 问题 时 ， 蚁 群 算法 有 很 大 的 
优越 性 ， 尤 其 是 TSP 问题 。 它 的 成 功 运用 吸引 了 国际 学 术 界 的 普遍 关 
注 ， 并 提出 了 各 种 有 益 的 改进 算法 。 在 了 解 这 些 改进 研究 之 前 ， 先 了 解 
一 下 基本 蚁 群 算法 的 不 足 。 

O) 每 次 解构 造 过 程 的 计算 量 较 大 ， 算 法 搜索 时 间 较 长 。 算 法 的 
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计算 复杂 度 主要 在 解构 造 过程 ， 比 如 TSP 问题 时 间 复杂 度 为 O(N。 
nm), 

(2) 算法 容易 出 现 停滞 现象 ， 即 搜索 进行 到 一 定 的 程度 后 ， 所 有 
蚂蚁 搜索 到 的 解 完全 一 致 ， 不 能 对 空间 进一步 进行 搜索 ， 不 利于 发 现 更 
好 的 解 。 

G) 基本 蚁 群 优化 算法 本 质 上 是 离散 的 ， 只 适用 于 组 合 优化 问题 ， 
对 于 连续 优化 问题 ( 函数 优化 ) 无 法 直接 应 用 ， 限 制 了 算法 的 应 用 
范围 。 

针对 蚁 群 算法 的 缺陷 ， 蚁 群 算法 的 改进 研究 主要 目的 有 两 点 。 一 是 
在 合理 的 时 间 内 提高 蚁 群 算法 的 寻 优 能 力 ， 改 善 其 全 局 收敛 性 ; 二 是 使 
其 能 够 应 用 于 连续 域 问 题 。 

在 介绍 蚁 群 算法 改进 研究 之 前 ， 先 了 解 蚁 群 算法 收敛 性 研究 的 成 
果 。 因 为 收敛 性 研究 可 以 为 改进 蚁 群 算法 提供 理论 依据 和 指导 。 


6.3.1 蚊 群 算法 的 收敛 性 研究 


所 有 的 仿生 优化 算法 都 要 考虑 收敛 性 问题 ， 蚁 群 算法 也 不 例外 。 虽 
然 蚁 群 算法 已 经 有 多 种 不 同 版 本 的 改进 算法 并 成 功 应 用 于 诸多 领域 ， 但 
大 部 分 是 经 验 性 的 实验 研究 ， 缺 乏 必要 的 理论 框架 及 相应 的 理论 基础 和 
依据 ， 只 有 少 部 分 改进 的 蚁 群 算法 给 出 了 收敛 性 证 明 ， 这 在 很 大 程度 上 
阻碍 了 蚁 群 算法 的 发 展 。 

最 先 开 始 蚁 群 算法 收敛 性 研究 的 是 Gutjahr WJ， 他 从 有 向 图 论 的 角 
度 对 一 种 改进 的 蚁 群 算法 GBAS(Graph-based Ant System) 的 收敛 性 进 
行 了 证 明 ; Sttitzle T 和 Dorigo M 针对 具有 组 合 优化 性 质 的 极 小 化 问题 提 
出 了 一 类 改进 蚁 群 算法 ACO。.,,.， 并 对 其 收敛 性 进行 了 理论 分 析 ; 针 
对 上 述 两 种 改进 蚁 群 算法 中 的 一 些 缺陷 ,根据 所 采用 的 信息 素 更 新 规则 
的 不 同 ，Gutjahr W J 又 提出 两 种 新 的 CBAS， 即 时 变 信 息 素 挥发 系数 
GBAS/TDEV 算法 (GBAS with Time-Dependent Evaporation Factor) 和 时 
变 信息 素 下 界 GBAS/TDLB 算法 (GBAS with Time-Dependent Lower 
Pheromone Bound) ， 证 明了 可 通过 选择 合适 的 参数 来 保证 蚁 群 算法 的 动 
态 随机 过 程 收敛 到 全 局 最 优 解 ，Hou Y H 等 对 一 类 广义 蚁 群 算法 (Gen- 
eralized Ant Colony Algorithm, GACA) 进行 的 基于 不 动 点 理论 的 收敛 性 
分 析 ; Yoo J H 等 对 一 类 分 布 式 蚂蚁 路 由 随机 算法 的 收敛 性 研究 ; Badr 
A 等 将 蚁 群 算法 模型 转化 为 分 支 随机 过 程 ， 从 分 支 随机 路 径 和 分 支 
Wiener 过 程 的 角度 推导 了 蚂蚁 路 径 存亡 的 比率 ， 并 证 明了 该 过 程 为 稳 
态 分 布 ; 孙 奏 等 对 一 类 简单 蚁 群 算法 的 收敛 性 及 有 关 参 数 问题 做 了 初步 
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研究 ; 丁 建立 等 对 一 种 遗传 - 蚁 群 算法 的 收敛 性 进行 了 Markov 理论 分 
析 ， 并 证 明 其 优化 解 满 意 值 序列 单调 不 增 且 收敛 ; 段 海滨 等 对 基本 蚁 群 
算法 进行 Markov 理论 分 析 ， 运 用 离散 著 (Discrete Martingale) 研究 工 
具 ， 提 出 蚁 群 算法 首 达 时 间 的 定义 ， 同 时 对 蚁 群 算法 首次 到 达 时 间 的 期 
望 值 作 了 初步 分 析 。 

算法 的 收敛 性 研究 不 仅 对 深入 理解 算法 机 理 具有 重要 的 理论 意义 ， 
而 且 对 改进 算法 、 编 写 算法 程序 具有 非常 重要 的 现实 指导 意义 。 蚁 群 算 
法 的 收敛 性 研究 是 一 个 非常 重要 的 研究 内 容 。 


6.3.2 离散 域 蚁 群 算法 的 改进 研究 


国内 外 ， 离 散 域 蚁 群 算法 的 改进 研究 成 果 很 多 ， 如 自 适应 蚁 群 算 
法 、 基 于 信息 素 扩散 的 蚁 群 算法 、 基 于 去 交叉 局 部 优化 策略 的 蚁 群 算 
法 、 多 态 蚁 群 算法 、 基 于 模式 学 习 的 小 窗口 蚁 群 算法 、 基 于 混合 行为 蚁 
群 算法 、 带 聚 类 处 理 的 蚁 群 算法 、 基 于 云 模型 理论 的 蚁 群 算法 、 具 有 感 
Ne AFA A EPR RA BAL hE RK, ETA A 
的 改进 蚁 群 算法 等 。 这 里 不 能 一 一 列举 ， 仅 介绍 离散 域 优化 问题 的 自 适 
应 蚁 群 算法 。 

什么 是 自 适应 蚁 群 算法 ? 即 对 蚊 群 算法 的 状态 转移 概率 、 信 息 素 挥 
发 因子 、 信 息 量 等 因素 采用 自 适应 调节 策略 为 一 种 基本 改进 思路 的 蚁 群 
算法 。 下 面 介绍 自 适应 蚁 群 算法 中 两 个 最 经 典 的 方法 ， 一 个 是 蚁 群 系统 
(Ant Colony System，ACS) ， 另 一 个 是 最 大 - 最 小 蚁 群 系统 ( MAX-MIN 
Ant System ，MMAS ) 。 

一 、 蚁 群 系统 (Ant Colony System, ACS) 

蚁 和 群 系统 (Ant Colony System, ACS) 模型 最 早 是 由 Dorigo, Gam- 
bardella 等 人 在 基本 蚁 群 算法 (AS) 的 基础 上 提出 的 。 下 面 介绍 ACS 蚁 
群 系统 模型 的 构成 和 算法 。 

ACS 解决 了 基本 蚁 群 算法 在 构造 解 过程 中 ， 随 机 选择 策略 造成 的 算 
法 进化 速度 慢 的 缺点 。 该 算法 在 每 一 次 循环 中 仅 让 最 短路 径 上 的 信息 量 
作 更 新 ， 且 以 较 大 的 概率 让 信息 量 最 大 的 路 径 被 选中 ， 充 分 利用 学 习 机 
制 ， 强 化 最 优 信息 的 反馈 。ACS 的 核心 思想 是 : 蚂蚁 在 寻找 最 佳 路 径 的 
过 程 中 只 能 使 用 局 部 信息 ， 即 采用 局 部 信息 对 路 径 上 的 信息 量 进行 调 
整 ， 在 所 有 进行 寻 优 的 蚂蚁 结束 路 径 的 搜索 后 ， 路 径 上 的 信息 量 会 再 一 
次 调整 ， 这 次 采用 的 是 全 局 信息 ， 而 且 只 对 过 程 中 发 现 的 最 好 路 径 上 的 
信息 量 进行 加 强 。ACS 模型 与 AS 模型 的 主要 区 别 有 3 A: 蚂蚁 的 状 
态 转移 规则 不 同 ; @ 全 局 更 新 规则 不 同 ; @@ 新 增 了 对 各 条 路 径 信息 量 调 
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整 的 局 部 更 新 规则 。 下 面 展开 介绍 。 
1. ACS 的 状态 转移 规则 
为 了 避免 停滞 现象 的 出 现 ，ACS 采用 了 确定 性 选择 和 随机 性 选择 相 
结合 的 选择 策略 ， 并 在 搜索 过 程 中 动态 调整 状态 转移 概率 。 即 对 位 于 城 
市 i 的 蚂蚁 按照 式 (6.9) 选择 下 一 个 城市 : 
a q<qo 


式 (6.10)， 
JUb, LO 是 第 只 蚂 驶 在 访问 到 城市 i 后 尚 需 访问 的 城市 集合 ，9 为 
一 个 在 区 间 (0, 1] 内 的 随机 数 ，g。 是 一 个 算法 参数 《0<g。<1); 当 
4 >g Hi, BA k ARABS (6.10) 确定 由 城市 i 向 下 转移 的 目标 城市 ， 
(rif I" + Ga 1^ re 
Y GGOFIkGorP (177 7 c 


eh) 
0, 其 他 

式 (6.9) 所 确定 的 蚂蚁 转移 到 下 一 个 城市 的 方法 称 为 自 适应 伪 随 机 概 
率 选 择 规则 (Pseudo-Random Proportional Rule) 。 在 这 种 规则 下 ， 每 当 
蚂蚁 要 选择 向 哪 一 个 城市 转移 时 ， 就 产生 一 个 在 [0, 1] 范围 内 的 随 
机 数 ， 根 据 这 个 随机 数 的 大 小 按 公 式 (6.9) 确定 用 哪 种 方法 产生 蚂蚁 
转移 的 方向 。 

2. ACS 全 局 更 新 规则 

在 ACS 蚁 群 算法 中 ， 全 局 更 新 不 再 用 于 所 有 的 蚂蚁 ， 而 是 只 对 每 
一 次 循环 中 最 优 的 蚂蚁 使 用 。 更 新 规则 如 下 式 : 
T(i) -p) + rij) +p Ari) (6.11) 


(6.9) 


n 
Py = 


且 
T Why, i) 四 为 全 局 最 优 路 径 且 Lu 是 最 短路 径 
Ar(i,j) -{ ó 其 他 
(6.12) 
其 中 ，L, 为 蚁 群 当前 循环 中 所 求 得 的 最 优 路 径 长 度 ; p 为 一 个 (0，1) 
区 间 的 参数 ， 其 意义 相当 于 蚁 群 算法 基本 模型 中 路 径 上 的 信息 素 挥 发 
系数 。 
3. ACS 局 部 更 新 规则 
局 部 更 新 规则 是 在 所 有 的 蚂蚁 完成 一 次 转移 后 执行 
Ti) -(0 7p) + (i,j) +p Ar(i,)) (6.13) 
其 中 , p 为 一 个 (0，1) 区 间 的 参数 ， 其 意义 也 相当 于 蚁 群 算法 基本 模 
型 中 路 径 上 的 信息 素 挥 发 系数 。Ar(i, j) 的 取 值 方法 有 下 列 三 种 方案 
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@Ar(iy) =0; 

@Ar(ij) =ro,ro 为 路 径 上 信息 量 的 初始 值 ; 

@Ar(i,j) =y- maxr(j,2), Xp IC) 表示 第 上 只 蚂蚁 在 访问 
到 城市 了 后 尚 需 访问 的 城市 集合 。 

上 述 采用 Ar (i, j) 取 值 的 第 @ 种 方案 的 ACS 算法 被 称 为 Ant -Q 
强化 学 习 的 蚁 群 算法 。 实 验 结果 表明 与 AS 基本 蚁 群 算法 相 比 ，Ant - Q 
system 模型 具有 一 般 性 ， 而 且 更 有 利于 全 局 搜索 。 

算法 的 实现 过 程 可 以 用 以 下 的 伪 代 码 来 表示 

begin 

初始 化 过 程 : 

ncycle 21; 

bestcycle 1; 

Ary(i, j) 7707€; a; Bs ps dos 
n, ( 由 某 种 启发 式 算法 确定 ); 
tabu, =Ø; 

while( not termination condition ) 

{for(k=1; k<m; k++) 


{ 将 严 个 蚂蚁 随机 放置 于 初始 城市 上 ;| 
for(index 20; index «n; index+ +) (index 为 当前 循环 中 已 
经 走 过 的 城市 个 数 ) 
{for(k=0; k<m; k+ +) 
{ 产 生 随机 数 q 
按 公式 (6.9) 和 式 (6.10) 规则 确定 每 只 蚂蚁 将 要 
转移 的 位 置 ; 


将 刚刚 选择 的 城市 /加 入 到 tabu, P; 
RAR (6.13) 执行 局 部 更 新 规则 ; 
! 
! 
确定 本 次 循环 中 找到 的 最 佳 路 径 L=min(L), k=1, 2, +, m; 
根据 式 (6.11) 和 式 (6.12) 执行 全 局 更 新 规则 ; 
ncycle = ncycle +1; 
! 
输出 最 佳 路 径 及 结果 ; 
end 
二 、 最 大 -最 小 蚂蚁 系统 (MAX -MIN Ant System, MMAS) 
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通过 对 蚊 群 系统 的 研究 表明 ， 将 蚂蚁 搜索 行为 集中 到 最 优 解 的 附近 
可 以 提高 解 的 质量 和 收敛 速度 ， 从 而 改进 算法 的 性 能 。 但 是 这 种 搜索 方 
式 会 使 算法 过 早 收敛 而 出 现 早 熟 现象 。 针 对 这 个 问题 ， 德 国学 者 Stutzle 
T 和 Hoos H H 提出 的 最 大 - 最 小 蚂蚁 系统 (MAX - MIN ant system, 
MMAS), 
MMAS 的 基本 思想 : 仅 让 每 一 代 中 的 最 好 个 体 所 走路 径 上 的 信息 量 
作 调 整 ， 从 而 更 好 地 利用 了 历史 信息 ， 以 加 快 收敛 速度 。 但 这 样 更 容易 
出 现 过 早 收敛 的 停滞 现象 ， 为 了 避免 算法 过 早 收敛 于 非 全 局 最 优 解 ， 将 
各 条 路 径 上 的 信息 量 限制 在 区 间 [Tans Toe) 之 内 ,超出 这 个 范围 的 
值 将 被 限制 为 信息 量 允 许 值 的 上 下 限 ， 这 样 可 以 有 效 地 避免 某 条 路 径 上 
的 信息 量 远大 于 其 他 路 径 而 造成 的 所 有 蚂蚁 都 集中 到 同一 条 路 径 上 ， 从 
而 使 算法 不 再 扩散 ， 加 快 收敛 速度 。MMAS 是 解决 TSP、QAP 等 离散 域 
优化 问题 的 最 好 蚁 群 算法 之 一 ， 很 多 对 蚁 群 算法 的 改进 算法 都 渗透 着 
MMAS 的 思想 。 
MMAS 蚁 群 算法 在 基本 蚁 群 算法 (AS). 的 基础 上 作 了 三 点 改进 : 
(1) 首先 初始 化 信息 量 r) =c 设 为 最 大 值 ro。 
(2) 其 次 各 个 蚂蚁 在 一 次 循环 后 ， 只 有 找到 最 短路 径 的 蚂蚁 才能 
够 在 其 经 过 的 路 径 上 释放 信息 素 。 即 
Tu(t+mn) 2 (172p) * T(t) + Anz" (6.14) 
Arg” =Q/L,L=min(L,) ,k 21,2, ,m (6.15) 
(3) 最 后 将 TO) 限定 在 [Tans Toe) 之 间 。 如 果 TyC) emus, 
则 y(t) =rusi MUR ry Ct) > Tms M TYLE) = Tauro 
算法 的 实现 过 程 可 以 用 以 下 的 伪 代 码 来 表示 : 
begin 
初始 化 过 程 : 
ncycle 21; 
bestcycle 21; 
TaniTasiTg = Tras ATs = 03 
7i( 由 某 种 启发 式 算法 确定 ) ; 
tabu, = Ø; 
while( not termination condition ) 
{for(k=1; k<m; k++) 
{将 m 个 蚂蚁 随机 放置 于 初始 城市 上 ;| 
for(index =0; index «n; index ++) (index 为 当前 循环 中 已 
经 走 过 的 城市 个 数 ) 
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{for(k=0; k<m; k++) 
{以 概率 p; (0). 选择 下 一 个 城市 j, je allowed, (1) ; 
将 刚刚 选择 的 城市 了 加 入 到 tabu, H; 
l 
| 
neycle = neycle + 1; 
确定 本 次 循环 中 找到 的 最 佳 路 径 L=min(L,), k=1, 2, =, 
根据 公式 (6.14), (6.15) 计算 A r° (ncycle) , T, (ncycle +1); 
如 果 rs(b <rua, 则 Ti(i = Tins 
如 果 74 (t) > Toes M Ty Ct) = Ter 
i 
输出 最 佳 路 径 及 结果 ; 
end 
除了 以 上 两 种 自 适应 改进 蚁 群 算法 外 ， 还 有 很 多 离散 域 改 进 蚁 群 算 
法 。 虽 然 这 些 改进 策略 的 侧重 点 和 改进 形式 不 同 ， 但 是 其 目的 是 相同 
的 ， 即 避免 陷 人 局 优 ， 缩 短 搜索 时 间 ， 提 高 蚁 群 算法 的 全 局 收敛 性 能 。 


6.3.3 连续 域 蚊 群 算法 的 改进 研究 


很 多 工程 上 的 实际 问题 通常 表达 为 一 个 连续 的 最 优化 问题 ， 并 随 着 
问题 规模 的 增 大 以 及 问题 本 身 的 复杂 度 增加 ， 对 优化 算法 的 求解 性 能 提 
出 越 来 越 高 的 要 求 。 而 基本 蚁 群 算法 优良 高 效 的 全 局 优化 性 能 却 只 能 适 
用 于 离散 的 组 合 优化 问题 。 因 为 基本 蚁 群 算法 的 信息 量 留存 、 增 减 和 最 
优 解 的 选取 都 是 通过 离散 的 点 状 分 布 求解 方式 来 进行 的 ， 所 以 基本 蚁 群 
算法 从 本 质 上 只 适合 离散 域 组 合 优化 问题 ， 离 散 性 的 本 质 限制 了 其 在 连 
续 优 化 领域 中 的 应 用 。 在 连续 域 优化 问题 的 求解 中 ,其 解 空间 是 一 种 区 
域 性 的 表示 方式 ， 而 不 是 以 离散 的 点 集 来 表示 的 。 因 此 ， 将 基本 蚁 群 算 
法 寻 优 策略 应 用 于 连续 空间 的 优化 问题 需要 解决 以 下 三 点 。 

1. 调整 信息 素 的 表示 、 分 布 及 存在 方式 

是 至 关 重要 的 一 点 ， 在 组 合 优化 问题 中 ， 信 息 素 存在 于 目标 问题 离 
散 的 状态 空间 中 相 邻 的 两 个 状态 点 之 间 的 连接 上 ， 蚂 蚁 在 经 过 两 点 之 间 
的 连接 的 时 候 释 放 信息 素 ， 影 响 其 他 蚂蚁 ， 从 而 实现 一 种 分 布 式 的 正 反 
馈 机 制 ， 每 一 步 求解 过 程 中 的 蚊 群 信息 素 留存 方式 只 是 针对 离散 的 点 或 
点 集 分 量 ; 而 用 于 连续 域 寻 优 问题 的 蚊 群 算法 ， 定 义 域 中 每 个 点 都 是 问 
题 的 可 行 解 ， 不 能 直接 将 问题 的 解 表示 成 为 一 个 点 序列 ， 显 然 也 不 存在 
点 间 的 连接 ， 只 能 根据 目标 函数 值 来 修正 信息 量 ， 在 求解 过 程 中 ， 信 息 


m; 
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素 物质 则 是 遗留 在 蚂蚁 所 走 过 的 每 个 节点 上 ， 每 一 步 求解 过 程 中 的 信息 
素 留 存 方式 在 对 当前 蚁 群 所 处 点 集 产 生 影响 的 同时 ， 对 这 些 点 的 周围 区 
域 也 产生 相应 的 影响 。 

2. 改变 蚊 群 的 寻 优 方式 

由 于 连续 域 问 题 求解 的 蚁 群 信息 留存 及 影响 范围 是 区 间 性 的 ， 非 点 
状 分 布 ， 所 以 在 连续 域 寻 优 过 程 中 ， 不 但 要 考虑 蚂蚁 个 体 当 前 位 置 所 对 
应 的 信息 量 ， 还 要 考虑 蚂蚁 个 体 当前 位 置 所 对 应 特定 区 间 内 的 信息 量 累 
计 与 总 体 信息 量 的 比较 值 。 

3. 改变 蚊 群 的 行进 方式 

将 蚁 群 在 离散 解 空间 点 集 之 间 跳 变 的 行进 方式 变 为 在 连续 解 空间 中 
微调 式 的 行进 方式 ， 这 一 点 较为 容易 。 

近年 来 ， 随 着 蚁 群 算法 的 不 断 发 展 ， 拓 展 蚁 群 优化 算法 的 功能 ， 使 
之 适用 于 连续 问题 已 经 有 了 一 些 成 果 ， 分 为 以 下 三 类 。 

(1) 将 蚁 群 优化 框架 与 进化 算法 结合 ， 从 而 实现 连续 优化 算法 。 

第 一 个 连续 蚁 群 算法 就 是 由 Bilehev G A 等 人 基于 这 种 思路 构建 的 ， 
求解 问题 时 先 使 用 遗传 算法 对 解 空间 进行 全 局 搜索 ， 然 后 利用 蚁 群 算法 
对 所 得 结果 进行 局 部 优化 ， 但 该 种 算法 在 运行 过 程 中 常会 出 现 蚂蚁 对 同 
一 个 区 域 进行 多 次 搜索 的 情况 ， 降 低 了 算法 的 效率 ; 杨 勇 等 人 提出 了 一 
种 求解 连续 域 优化 问题 的 嵌入 确定 性 搜索 蚁 群 算法 ， 该 算法 在 全 局 搜索 
过 程 中 ， 利 用 信息 素 强度 和 启发 式 函数 确定 蚂蚁 移动 方向 ， 而 在 局 部 搜 
索 过 程 中 嵌入 了 确定 性 搜索 ， 以 改善 寻 优 性 能 ， 加 快 收敛 速度 。 

(2) 将 连续 空间 离散 化 ， 从 而 将 原 问题 转化 为 一 个 离散 优化 问题 ， 
然后 应 用 基本 蚁 群 优化 算法 的 原理 来 求解 。 

高 尚 等 人 提出 了 一 种 基于 网 格 划分 策略 的 连续 域 蚁 群 算法 ; TENERAS 
人 提出 的 基于 信息 量 分 布 函 数 的 连续 域 蚁 群 算法 ; 李 艳 君 等 人 提出 了 一 
种 用 于 连续 域 优化 问题 求解 的 自 适应 蚁 群 算法 ; 段 海 滨 等 人 提出 一 种 基 
于 网 格 划分 策略 的 自 适应 连续 域 蚁 群 算法 ; 陈 赎 等 人 提出 的 一 种 基于 交 
叉 变异 操作 的 连续 域 蚁 群 算法 等 。 采 用 这 种 方式 来 研究 的 比较 多 ,但 当 
问题 规模 增 大 时 ， 经 离散 化 后 ， 问 题 的 求解 空间 将 急剧 增 大 ， 寻 优 难度 
将 大 大 增加 。 对 于 较 大 规模 的 连续 优化 问题 这 类 方法 的 适应 性 还 有 待 进 
一 步 的 验证 。 

(3) 对 蚂蚁 行为 模型 进行 更 加 深入 的 、 广 泛 的 研究 ， 从 而 构造 新 
的 蚁 群 算法 ， 应 用 于 连续 问题 的 求解 。 

Dréo J 等 人 提出 了 一 种 基于 密集 非 递 阶 的 连续 交互 式 蚊 群 算法 
CIACA ， 该 算法 通过 修改 信息 素 的 留存 方式 和 行走 规则 ， 并 运用 信息 素 
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交流 和 直接 通信 两 种 方式 来 指导 蚂蚁 寻 优 ; Pourtakdoust S H 等 人 提出 
了 一 种 仅 依赖 信息 素 的 连续 域 蚁 群 算法 ; 张 勇 德 等 人 提出 了 一 种 用 于 求 
解 带 有 约束 条 件 的 多 目标 函数 优化 问题 的 连续 域 蚁 群 算法 。 

由 于 篇 幅 所 限 ， 这 里 不 能 一 一 列举 ， 仅 介绍 两 种 ， 即 (1) 中 , 杨 
勇 等 人 提出 的 嵌入 确定 性 搜索 的 连续 域 蚁 群 算法 ; (3) H, Dréo FA 
提出 的 基于 密集 非 递 阶 的 连续 交互 式 蚁 群 算法 CIACA。 

1. 嵌入 确定 性 搜索 的 连续 域 蚊 群 算法 

嵌入 确定 性 搜索 的 连续 域 蚁 群 算法 在 全 局 搜索 过 程 中 ， 利 用 信息 素 
强度 和 启发 式 函 数 确定 蚂蚁 的 移动 方向 ;而 在 局 部 搜索 过 程 中 ， 典 和 了 
确定 性 搜索 ， 以 改善 寻 优 性 能 ， 加 快 收敛 速 率 。 

设 优化 函数 为 max Z =f(X), m 只 蚂蚁 随机 分 布 在 定义 域内 ,每 只 
蚂蚁 都 有 一 个 邻 域 ， 其 半径 为 r。 每 只 蚂蚁 在 自己 的 领域 内 进行 搜索 ， 
当 所 有 蚂蚁 完成 局 部 搜索 后 ， 蚂 蚁 个 体 根据 信息 素 强度 和 启发 式 函 数 在 
全 局 范围 内 进行 移动 ， 完 成 一 次 循环 后 ， 则 进行 信息 素 强度 的 更 新 
计算 。 

(1) 局 部 搜索 

局 部 搜索 是 指 每 只 蚂蚁 在 自己 的 邻 域 空间 内 进行 随机 搜索 。 设 新 的 
位 置 点 为 X'"， 如 果 新 的 位 置 值 比 原来 目标 函数 值 大 ， 则 取 新 位 置 ， 否 
则 会 去 。 局 部 搜索 是 在 半径 为 + 的 区 域内 进行 的 ， 且 " 随和 迭代 次 数 的 增 
加 而 减少 。 有 
-人 fO) >SK) (6.16) 

X, ”其 他 

(2) 全 局 搜索 

全 局 搜索 是 指 每 只 蚂蚁 都 经 过 一 次 局 部 搜索 后 ， 选 择 停留 在 原 地 、 
转移 到 其 他 蚂蚁 的 邻 域 或 进行 全 局 随机 搜索 。 设 Act(i) 为 第 i 只 蚂蚁 
选择 的 动作 ，_f. 为 m 只 蚂蚁 的 目标 函数 平均 值 ， 则 有 

Act( i) ne SX) «f. «qo (6.17) 
s, 其 他 
其 中 ,gq 为 一 个 在 区 间 [0, 1] 内 的 随机 数 ; qu 是 一 个 算法 参数 (0< 
q<1); S 按 如 下 转移 规则 选择 动作 : 


p(i,j) = De (6.18) 

Zr(j)e 了 
vb, dA) -/(X), BS ime] 时， 由 <0; 而 当 i=j 时 ,ds =0。 
sk (618) 保证 了 第 ;只 蚂蚁 按 概率 向 其 他 目标 函数 值 更 大 的 蚂蚁 的 
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邻 域 移动 ， 其 中 系数 了 的 大 小 决定 了 这 个 概率 函数 的 斜率 。 

蚂蚁 向 某 个 信息 素 强度 高 的 地 方 移动 时 ， 可 能 会 在 转移 路 途中 的 一 
个 随机 地 点 发 现 新 的 食物 源 ， 这 里 将 其 定义 为 有 向 随机 转移 。 第 i 只 蚂 
蚁 向 第 j 只 蚂蚁 的 邻 域 转移 的 公式 为 

X, p<po 
Rs XA (6.19) 

其 中 , 0 <p <1; p, 50; a<1。 

(3) 信息 素 强度 更 新 规则 

全 局 搜索 结束 后 ， 要 对 信息 素 强度 进行 更 新 。 更 新 规则 为 : 如 果 有 
n 只 蚂蚁 向 蚂蚁 j 处 移动 (包括 有 向 随机 搜索 )， 则 有 


T) = Brij) + Ys (6.20) 


PN: IET i 
JUb, Ar = 7550 <B<1 是 遗忘 因子 。 


以 上 3 个 步骤 模仿 了 自然 界 蚂蚁 寻 食 的 过 程 ， 蚂 蚁 个 体 通过 局 部 随 
机 搜索 寻找 食物 源 ， 然 后 利用 信息 素 交换 信息 ， 决 定 全 局 转移 方向 。 全 
局 随机 搜索 的 蚂蚁 承担 搜索 陌生 新 食物 源 的 任务 ， 本 质 上 也 是 一 种 随机 
性 搜索 算法 。 

(4) 媒人 和 确定 性 搜索 

随机 性 搜索 算法 存在 着 求解 效率 较 低 、 求 解 结果 较 分 散 等 缺点 ， 因 
此 有 必要 引入 确定 性 搜索 ， 对 其 加 以 改进 。 这 里 考虑 使 用 确定 性 搜索 中 
的 直接 法 ， 直 接 法 只 利用 函数 信息 而 不 需要 利用 导数 信息 ， 甚 至 不 要 求 
函数 连续 ， 适 用 面 较 广 ， 易 于 编程 ， 避 免 复杂 计算 。 常 用 的 直接 法 包括 
网 格 法 、 模 式 搜索 法 、 二 坐标 轮换 法 等 ， 文 中 采用 了 模式 搜索 法 中 的 步 
长 加 速 法 。 

步 长 加 速 法 是 在 坐标 轮换 法 的 基础 上 发 展 起 来 的 ， 包 括 探测 性 搜索 
和 模式 性 移动 两 部 分 。 首 先 依次 沿 坐 标 方向 探索 ， 称 之 为 探测 性 搜索 ; 
然后 经 此 探测 后 求 得 目标 函数 的 变化 规律 ， 从 而 确定 搜索 方向 并 沿 此 方 
向 移动 ， 称 之 为 模式 移动 。 重 复 以 上 两 步 ， 直 到 探测 步 长 小 于 充分 小 的 
正 数 e Wik, 具体 步骤 参见 文献 [3] 。 

工人 确定 性 搜索 的 蚁 群 算法 ， 是 在 局 部 搜索 时 以 一 定 的 概率 利用 步 
长 加 速 法 进行 确定 性 搜索 。 局 部 搜索 规则 如 下 : 

"n Co. aa "€ (6.21) 
按 公式 (6.16) 进行 局 部 随机 搜索 ， 其 他 

Jb, v 是 随机 数 且 0 <v<1; v, 是 算法 系数 且 0 <v <1。 
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嵌入 确定 性 搜索 的 蚁 群 算法 的 具体 步骤 如 下 
初始 化 ; 
Loop; 
每 只 蚂蚁 处 于 每 次 循环 的 开始 位 置 ; 
Loop; 
每 只 蚂蚁 利用 式 (6.21) 进行 局 部 搜索 ; 
Until 所 有 蚂蚁 完成 局 部 搜索 ; 
Loop; 
每 只 蚂蚁 进行 全 局 搜索 ， 按 式 (6.17) ~ (6. 19) 选 择 要 进行 的 
动作 ; 
Until 所 有 蚂蚁 完成 全 局 搜索 ; 
按 式 (6.20) 进行 信息 素 强度 更 新 ; 
Until 中 止 条 件 。 
2. 基于 密集 非 递 阶 的 连续 交互 式 蚊 群 算法 (CIACA) 
基于 密集 非 递 阶 的 连续 交互 式 蚁 群 算法 (Continuous Interacting Ant 
Colony Algorithm, CIACA) 的 思想 源 于 对 自然 界 中 真实 蚁 群 行为 和 求解 
连续 域 优 化 问题 蚁 群 算法 机 理 的 进一步 研究 。 该 算法 通过 修改 蚂蚁 信息 
素 的 留存 方式 和 蚂蚁 的 行走 规则 ， 并 运用 信息 素 交 流 和 直接 通信 两 种 方 
式 来 指导 蚂蚁 寻 优 。CIACA 是 一 种 崭新 的 蚁 和 群 算法 。 在 介绍 CIACA 之 
前 ， 先 了 解 一 下 密集 非 递 阶 的 生物 学 概念 。 
(1) 密集 非 递 阶 的 概念 和 简单 的 非 递 阶 算法 
D 密集 非 递 阶 的 概念 
“密集 非 递 阶 (Dense Heterarchy) ”最 早 由 Wilson E D 于 1988 年 提 
出 。“ 蚁 群 是 一 个 特殊 的 层次 结构 ， 可 称 之 为 非 递 阶 结构 。 这 意味 着 较 
高 层次 单元 的 性 质 在 一 定 程度 上 影响 着 较 低 的 一 层 ， 而 被 较 高 层次 影响 
后 的 较 低层 次 单元 会 反 过 来 影响 较 高 层次 ”， 这 一 思想 提出 了 两 种 通信 
通道 ， 即 基于 信息 素 轨迹 交流 通信 通道 和 蚂蚁 个 体 间 直 接 通 信 通 道 ,这 
两 种 通道 对 于 蚁 群 算法 非常 重要 。 “密集 非 递 阶 ” 用 于 描述 蚁 群 从 环境 
中 接受 “信息 流 ” 方 式 的 一 个 基本 概念 ， 每 只 蚂蚁 都 可 在 任意 时 刻 与 
其 他 蚂蚁 进行 联络 ， 而 蚁 群 中 的 信息 流 是 通过 多 个 通信 通道 传输 的 。 
为 了 形象 说 明 密集 非 递 阶 结构 与 层次 结构 的 不 同 ， 参 考 图 6.4。 层 
次 结构 是 一 种 金字 塔 形 的 结构 ， 就 像 是 部 队 中 军 长 传令 给 师长 ， 师 长 传 
令 给 旅 长 ， 其 余 以 此 类 推 。 而 密集 非 递 阶 结构 中 ,“ 蚁 后 ”并 不 传令 给 
其 他 蚂蚁 ， 而 是 作为 蚁 群 网 络 中 的 普通 一 员 ， 这 种 没有 “层次 ”的 系 
统 具 有 很 强 的 自 组 织 功 能 。 
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~ 
(5) 


图 6.4 层次 结构 与 非 递 阶 结构 示意 图 
Q 简单 的 非 递 阶 算法 
这 里 先 介绍 一 个 简单 的 非 递 阶 算法 ， 该 算法 利用 了 通信 通道 的 基本 
思想 ， 一 个 通信 通道 是 信息 素 的 存放 地 ， 可 用 来 传递 多 种 信息 ， 如 图 
6.5 所 示 。 


图 6.5 信息 通道 示意 图 


信息 通道 的 基本 性 质 如 下 。 

a 范围 : 即 蚁 群 中 信息 素 的 交流 方式 ， 蚁 群 中 的 某 一 子 群 可 与 另 
一 子 群 进行 信息 交流 。 

b. 存储 : 即 信息 素 在 系统 中 的 驻 留 方式 ， 信 息 素 可 在 某 一 时 间 段 
内 被 一 直 保留 。 


c. 集成 : 即 信息 素 在 系统 中 的 进化 方式 ， 信 息 素 可 通过 一 个 外 部 
过 程 被 一 只 或 多 只 蚂蚁 更 新 ， 也 可 不 更 新 。 

上 述 性 质 都 集聚 于 同一 信息 通道 ， 这 样 就 形成 了 许多 不 同 种 类 的 信 
息 通 道 。 蚂蚁 通信 中 所 传递 的 信息 具有 多 种 形式 ， 有 时 很 难 描述 某 些 特 
殊 类 别 的 信息 。 

(2) CIACA 通信 通道 

按照 采用 通信 通道 的 不 同 ， 定 义 了 三 种 版 本 的 CIACA。 即 信息 素 交 
流 的 CIACA， 利 用 个 体 之 间 的 直接 通信 的 CIACA 和 二 者 协同 的 CIACA。 
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CD 信息 素 交流 的 CIACA 

第 一 个 版 本 的 CIACA 45 Bilehev G A 等 率先 提出 的 用 于 求解 连续 域 
优化 问题 的 改进 蚁 群 算法 很 接近 。 该 算法 受 蚂蚁 的 信息 素 存留 启发 而 设 
置 了 一 个 通信 通道 ， 每 只 蚂蚁 在 其 搜索 空间 内 的 某 一 节点 上 释放 一 定量 
的 信息 素 ， 节 点 上 的 信息 量 与 其 所 搜索 到 的 目标 函数 值 成 正比 。 这 些 信 
息 节点 能 够 被 蚊 群 中 的 所 有 个 体察 觉 ， 并 逐渐 消失 。 蚂 蚁 根据 路 径 距离 
和 路 径 上 的 信息 量 来 决定 是 否 选择 这 些 信息 节点 。 蚂 蚁 会 向 着 信息 素 点 
集 云 的 重心 C 移动 ， 而 重心 位 置 依 赖 于 第 i 个 节点 上 第 j 只 蚂蚁 的 “ 兴 


趣 ”w,， 表 示 如 下 : 
6-À EM (6.22) 


beens (6.23) 


Ht, n 表示 节点 数目 ; n 表示 第 i 个 节点 的 位 置 ; 5 表示 蚁 群 中 两 只 
蚂蚁 间 的 平均 距离 ; 0, 表示 第 i 个 节点 上 的 信息 量 ; 5, 表示 从 第 j 只 蚂 
蚁 到 第 i 个 节点 之 间 的 距离 。 值 得 注意 的 是 ， 处 于 信息 素 节 点 上 的 蚂蚁 
并 不 径直 地 向 信息 素 点 集 云 的 重心 移动 。 事 实 上 ， 每 只 蚂蚁 都 有 在 蚁 群 
中 均匀 分 布 的 参数 调整 范围 ， 每 只 蚂蚁 都 得 到 一 个 允许 范围 内 的 随机 距 
离 ， 蚂 蚁 会 以 随机 距离 为 度量 向 着 其 重心 位 置 移动 ， 但 是 某 些 干扰 因素 
可 能 会 影响 蚂蚁 所 到 达 的 最 终 位 置 。 

从 非 递 阶 概念 的 角度 来 描述 上 述 行为 ， 该 CIACA 中 信息 素 交 流通 
道 的 性 质 如 下 。 

a 范围 : 当 蚁 群 中 某 只 蚂蚁 留 下 一 定量 的 信息 素 后 ， 其 他 后 继 蚂 
蚁 都 能 觉察 到 该 信息 素 的 存在 。 

b. 存储 : 某 一 时 间 段 内 信息 素 将 被 一 直 保留 于 蚁 群 系统 之 中 。 

c. 集成 : 由 于 信息 素 的 挥发 作用 ， 随 着 时 间 的 推移 信息 素 将 被 
更 新 。 

@ 利用 个 体 之 间 的 直接 通信 的 CIACA 

每 只 蚂蚁 都 能 给 另 一 只 蚂蚁 发 送 “ 消 息 ”， 这 意味 着 该 通信 通道 
的 范围 是 “点 对 点 ” 式 的 。 蚂 蚁 可 将 已 经 接收 到 或 将 要 接收 到 的 信息 
存储 到 栈 中 ， 而 栈 中 的 信息 可 被 随机 读 取 。 此 处 所 发 送 的 “消息 ”是 
信息 发 送 者 的 位 置 ， 即 目标 函数 值 。 信 息 接收 者 会 将 发 送 者 所 发 送 来 
的 “消息 ”与 其 自身 的 信息 相 比较 ， 以 决定 它 是 否 要 向 信息 发 送 者 的 
位 置 移 动 。 最 终 位 置 将 出 现在 一 个 以 信息 发 送 者 为 中 心 、 信 息 接收 者 
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范围 为 半径 的 超 球 体内 ， 然 后 信息 接收 者 将 “消息 ”进行 压缩 并 将 其 
随机 发 送 给 另 一 只 蚂蚁 。 此 时 ,该 CIACA 中 的 信息 通道 具有 如 下 


当 蚊 群 中 的 某 只 蚂蚁 发 出 “消息 ”后 ， 仅 有 一 只 蚂蚁 可 
以 觉察 到 此 “消息 ”。 

b. 存储 : 某 一 时 间 段 内 信息 可 以 以 “记忆 ”的 形式 保存 在 蚁 群 系 
统 中 。 

c. 集成 : 所 存储 的 信息 是 静态 的 。 

图 二 者 协同 的 CIACA 

信息 素 交流 的 CIACA 和 利用 个 体 之 间 的 直接 通信 的 CIACA 具有 
很 大 的 不 同 ， 自 组 织 的 作用 可 将 较 低层 次 的 个 体 整 合成 较 高 层次 的 整 
体 。 基 于 这 一 思想 ， 可 将 上 述 两 种 版 本 的 CIACA 算法 中 的 简单 通信 
通道 融合 于 一 个 系统 中 ， 由 于 通信 通道 没有 并 发 机 制 ， 所 以 实现 起 来 
很 容易 。 

(3) CIACA 

CIACA 的 程序 结构 流程 如 图 6.6 所 示 ， 算 法 步骤 主要 包括 以 下 
3 步 。 

第 1 步 : 设置 参数 。 

第 2 步 : 算法 开始 。 

第 3 步 : 若 满足 结束 条 件 ， 算 法 结束 。 

蚂蚁 根据 其 在 通信 通道 系统 中 所 处 理 的 感知 信息 进行 移动 ， 需 要 设 
RATS. 

Dnel0, +>): 系统 中 蚂蚁 的 数目 ， 其 值 可 通过 式 (6.24) 
获得 

= Man(1—e7*) +1 (6.24) 

其 中 ，d 表示 目标 函数 的 维 数 ; 7 表示 最 大 蚂蚁 数目 ,一 般 设置 
Naa =1 000; mo 表示 目标 函数 维 数 为 0 时 的 蚂蚁 数目 ， 一 般 设 置 ye = 
5; p 表示 蚂蚁 数目 的 相对 重要 性 ， 一 般 设 置 p =10。 

@ oe [0, 1]: 搜索 空间 度 的 百分比 ， 用 来 定义 蚂蚁 移动 范围 分 
布 的 标准 偏差 ， 其 经 验 值 为 0.9。 

@pel0, 1]: 用 来 定义 信息 素 的 持久 性 ， 其 经 验 值 为 0. 1。 


@ pe [0, +e): “MA HIHA, METALAN = 了 
获得 。 
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设置 蚂蚁 移动 范围 的 分 布 


将 蚂蚁 随机 放置 于 搜索 空间 


获取 节点 重心 
获取 蚂蚁 移动 范围 内 的 随机 距离 
向 重心 位 置 移 动 一 个 随机 距离 


| 把 “消息 ”发 给 任意 蚂蚁 


向 目前 节点 周围 移动 


所 有 蚂蚁 移动 完毕 ? 
à d 
信息 素 挥发 


满足 结束 条 件 ? 


图 6.6 CIACA 的 程序 结构 流程 
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6.4 蚁 群 算法 与 其 他 仿生 优化 算法 的 比较 与 融合 


自从 20 世纪 50 年 代 以 来 ， 人 们 从 生物 进化 的 机 理 中 受到 启发 ， 构 
造 和 设计 出 许多 仿生 优化 算法 ， 如 遗传 算法 、 蚁 群 算法 、 粒 子 群 算法 、 
捕食 搜索 算法 等 。 它 们 都 属于 一 类 模拟 自然 界 生物 系统 行为 或 过 程 的 最 
优化 仿生 智能 算法 。 它 们 有 着 自己 的 特点 ， 适 合 不 同类 型 的 实际 问题 ， 
但 在 某 些 方面 又 不 谋 而 合 。 为 了 更 好 地 发 挥 这 些 仿生 优化 算法 的 作用 来 
解决 实际 问题 ， 学 者 们 将 这 些 算法 融合 在 一 起 。 在 介绍 这 些 融 合算 法 之 
前 ， 先 分 析 这 些 仿生 算法 的 异同 。 


6.4.1. 蚊 群 算法 与 其 他 仿生 优化 算法 的 比较 


蚁 群 算法 与 遗传 算法 、 粒 子 群 算法 、 捕 食 搜索 算法 都 属于 仿生 优化 
算法 ， 它 们 都 属于 一 类 模拟 自然 界 生物 系统 、 完 全 依赖 生物 体 自身 本 
能 、 通 过 无 意识 寻 优 行为 来 优化 其 生存 状态 以 适应 环境 需要 的 最 优化 智 
能 算法 。 它 们 有 如 下 相同 点 。 

(1) 都 是 一 类 不 确定 的 概率 型 全 局 优化 算法 。 仿 生 优化 算法 的 不 
确定 性 是 伴随 其 随机 性 而 来 的 ， 其 主要 步骤 含有 随机 因素 ， 有 更 多 的 机 
会 求 得 全 局 最 优 解 ， 比 较 灵活 。 

(2) 都 不 依赖 于 优化 问题 本 身 的 严格 数学 性 质 ， 都 具有 稳健 型 。 
在 优化 过 程 中 都 不 依赖 于 优化 问题 本 身 的 严格 数学 性 质 (如 连续 性 、 
可 导 性 ) 以 及 目标 函数 和 约束 条 件 的 精确 数学 描述 。 因 此 用 仿生 优化 
算法 求解 许多 不 同 问题 时 ， 只 需要 设计 相应 的 评价 函数 ， 而 基本 上 无 需 
修改 算法 的 其 他 部 分 。 在 不 同 条 件 和 环境 下 算法 的 适用 性 和 有 效 性 
很 强 。 

(3) 都 是 一 种 基于 多 个 智能 体 的 仿生 优化 算法 。 仿 生 优化 算法 中 
的 各 个 智能 体 之 间 通 过 相互 协作 来 更 好 地 适应 环境 ， 表 现 出 与 环境 交互 
的 能 力 。 

(4) 都 具有 本 质 并 行 性 。 仿 生 优 化 算法 的 本 质 并 行 性 表现 在 两 个 
方面 ， 一 是 仿生 优化 计算 的 内 在 并 行 性 ， 即 仿生 优化 算法 本 身 非常 适合 
大 规模 并 行 ; 二 是 仿生 优化 计算 的 内 含 并 行 性 ， 这 使 得 仿生 优化 算法 能 
以 较 少 的 计算 获得 较 大 的 收益 。 

(5) 都 具有 突现 性 。 仿 生 优化 算法 总 目标 的 完成 是 在 多 个 智能 体 
个 体 行为 运动 过 程 中 突现 出 来 的 。 

(6) 都 具有 自 组 织 性 和 进化 性 。 在 不 确定 复杂 环境 中 ， 仿 生 优 化 
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算法 可 通过 自学 习 不 断 提高 算法 中 个 体 的 适应 性 。 

遗传 算法 、 蚁 群 算法 、 粒 子 群 算法 、 捕 食 搜索 算法 虽然 都 属于 仿生 
优化 算法 ,但 它们 在 算法 机 理 、 实 现形 式 等 方面 存在 许多 不 同 之 处 。 

O) 遗传 算法 : 以 决策 变量 的 编码 作为 运算 对 象 ， 借 鉴 了 生物 学 
中 的 染色 体 概念 ， 模 拟 自然 界 中 生物 遗传 和 进化 的 精英 策略 ， 采 用 个 体 
评价 函数 进行 选择 操作 ， 并 采用 交叉 、 变 异 算 子 产生 新 的 个 体 ， 使 算法 
具有 较 大 的 灵活 性 和 可 扩展 性 。 缺 点 : 求解 到 一 定 范围 时 往往 做 大 量 无 
为 的 元 余 迭 代 ， 求 精确 解 效率 低 。 

(2) 蚁 群 算法 : 采用 了 正 反 馈 机 制 或 称 是 一 种 增强 型 学 习 系统 ， 
通过 不 断 更 新 信息 素 达 到 最 终 收敛 于 最 优 路 径 的 目的 ， 这 是 蚁 群 算法 不 
同 于 其 他 仿生 优化 算法 最 为 显著 的 特点 。 缺 点 : 蚁 群 算法 需要 较 长 的 搜 
索 时 间 ， 且 容易 出 现 停滞 现象 ， 且 该 算法 的 收敛 性 能 对 初始 化 参数 的 设 
置 比较 敏感 。 

(3) 粒子 群 算法 : 是 一 种 简单 容易 实现 又 具有 深刻 智能 背景 的 启 
发 式 算法 ， 与 其 他 仿生 优化 算法 相 比 ， 该 算法 所 需 代 码 和 参数 较 少 ， 而 
且 受 所 求 问题 维 数 的 影响 较 小 。 缺 点 : 粒子 群 算法 的 数学 基础 相对 薄 
弱 ， 缺 少 深刻 的 数学 理论 分 析 。 

(4) 捕食 搜索 算法 : 不 是 一 种 具体 的 寻 优 计算 方法 ， 本 质 上 是 一 
种 平衡 局 域 搜索 和 全 局 搜索 的 策略 。 捕 食 搜 索 的 全 局 搜索 负责 对 解 空间 
进行 广度 探索 ， 局 域 搜索 负责 对 较 好 区 域 进行 深度 开发 。 二 者 结合 起 来 
具有 搜索 速度 快 ， 搜 索 质量 高 ， 有 效 避 免 陷入 局 优等 优点 。 


6.4.2 蚊 群 算法 与 其 他 仿生 优化 算法 的 融合 


蚁 群 算法 具有 较 强 的 鲁 棒 性 、 优 良 的 分 布 式 计算 机 制 、 易 于 与 其 他 
方法 结合 等 优点 。 利 用 蚁 群 算法 以 上 优点 ， 将 其 与 其 他 仿生 优化 算法 柄 
合 ， 得 到 很 多 融合 策略 ， 如 蚁 群 算法 与 遗传 算法 融合 策略 、 蚁 群 算法 与 
粒子 群 算法 融合 策略 等 。 由 于 篇 幅 所 限 ， 仅 介绍 蚁 群 算法 与 遗传 算法 的 
融合 策略 。 

蚁 群 算法 与 遗传 算法 的 融合 

蚁 群 算法 与 遗传 算法 相 融合 是 蚁 群 算法 与 仿生 优化 算法 相互 融合 方 
面 研究 最 早 且 应 用 最 广 的 一 个 尝试 。 最 早 开始 于 Abbattista F 等 提出 的 
将 遗传 算法 (CA) 和 蚁 群 算法 相 融 合 的 改进 策略 ， 并 在 Oliver30TSP 和 
Filon50TSP 的 仿真 试验 中 得 到 了 较 好 的 结果 ; 随后 ， 大 量 的 研究 将 蚁 群 
算法 与 GA 相 融 合 解决 离散 域 和 连续 域 中 的 多 种 优化 问题 ， 并 取得 了 较 
好 的 应 用 效果 。 下 面 分 别 对 离散 域 和 连续 域 中 蚁 群 算法 与 遗传 算法 典型 
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融合 策略 作 详细 介绍 。 

(1) 离散 域 蚁 群 遗 传 算法 

Pilat M L 等 采用 GA 对 蚁 群 算法 中 3 个 参数 8，p，g。 进行 优化 ,但 
Xt B, p, qo 的 取 值 是 相对 于 a 的 一 个 比值 ，a 取 默 认 值 ， 所 以 无 法 实 
现 对 蚁 群 算法 4 个 组 合 参数 a, B, p, q, 的 全 局 寻 优 ， 也 就 很 难 求 得 
TSP 的 全 局 最 优 解 。 针 对 此 问题 ， 孙 力 娟 等 人 研究 了 一 种 求解 离散 域 优 
化 问题 的 蚊 群 遗传 算法 (Ant Colony Algorithm Genetic Algorithm, 
ACAGA) ， 其 核心 是 应 用 GA 对 蚁 群 算法 的 4 个 参数 (o. B, p. 9) 
进行 优化 ， 并 运用 MMAS 改进 蚁 群 算法 的 寻 径 行为 ， 以 实现 对 搜索 空 
间 高 效 、 快 速 地 全 局 寻 优 。 

求解 离散 域 优化 问题 的 ACAGA 算法 的 伪 代 码 如 下 : 

For iteration = 0 to Generation do 

对 参加 进化 的 每 个 个 体 的 变量 o, B, p, qo 进行 随机 编码 ; 

从 个 体 中 随机 地 选择 4 个 ; 

根据 给 出 的 4 个 变量 的 值 ， 求 适应 度 函数 值 ， 即 4 个 个 体 分 别 进行 
TSP 寻 径 ; 

第 1 步 : 初始 化 

120; //t 是 计时 器 

N, 20; //N, 是 循环 计数 器 

对 所 有 的 边 (i, j) 上 的 信息 素 赋 初始 值 ry(D = const, Ar, =0; 

将 4 只 蚂蚁 随机 地 放置 在 n 个 节点 上 ; 

第 2 步 : s=1; // 变 量 * 是 蚂蚁 上 在 一 次 寻 径 过 程 中 走 的 步 数 

For k 21 to 4 do 

将 第 上 只 蚂蚁 的 初始 节点 放 和 人 数组 tabu (s); 

Js) 2 (0, 2, 3, =, n) -tabu(s); //J,(s) MRL k FER s 步 时 
尚未 经 过 的 节点 集合 

第 3 步 : s=s+1; 

For k 21 to 4 do 

根据 状态 转移 概率 公式 选择 蚂蚁 上 的 下 一 跳 节 点 方 IUE HE Bt 
刻 处 在 节点 i m tabu (s - 1) 

将 蚂蚁 上 放置 于 节点 j， 并 将 节点 j 插 入 数组 tabu, (s) ; 

tabu (s) =j; J4(3) =J(s -1) -j; 

对 链 路 进行 局 部 信息 素 更 新 ; 

重复 第 3 步 ， 直到 s=n 

第 4 步 : Fork-1 to 4 do 
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将 蚂蚁 从 节点 tabus(n) 移 到 tabui(1); // 蚂 蚁 回 到 初始 节点 ， 完 
成 一 次 回路 寻 径 
计算 蚂蚁 的 路 由 长 度 L,， 并 比较 其 大 小 ; 
求 得 最 短 长 度 Pr 及 其 对 应 的 ks 和 tabuy i 
对 链 路 进行 全 局 信息 素 更 新 ; 
得 到 任意 条 边 的 信息 素 浓度 值 rv(t+n); 
第 5 步 : t=t+n; 
N,=N, +1; 
HCN, < Nomex) and 没有 停滞 行为 
Then 
| 清空 所 有 tabu 列表 ; 
跳 转 到 第 2 步 ;} 
else 
将 寻 径 后 的 最 短路 径 长 度 作为 适应 度 函 数 ， 
从 被 选 的 4 个 个 体 中 选 出 2 个 最 优 个 体 ; 
进行 交叉 和 变异 操作 生成 2 个 子 个 体 ; 
替代 4 个 个 体 中 最 差 的 2 个 ， 放 入 待 进化 的 个 体 中 ; 
End for 
输出 最 优 结果 
上 述 伪 代码 流程 中 ， 针 对 参加 遗传 运算 的 每 只 蚂蚁 ， 对 蚁 群 算法 中 
804 ^23 a, B, p, qu 进行 了 28 bit 编码 ， 其 中 每 一 参数 占用 7 bit. 
(2) 连续 域 蚁 群 遗 传 算法 
邵 晓 疾 等 人 提出 的 “利用 信息 量 留存 的 蚁 群 遗 传 算法 ”将 空间 进 
行 均匀 分 割 ， 基 于 这 些 子 空间 选取 初始 种 群 ， 并 定义 每 个 子 空间 的 初始 
信息 量 ， 遗 传 操作 中 根据 信息 量 的 留存 情况 来 控制 个 体 选择 。 因 为 在 求 
解 优化 问题 前 ， 通 常 不 会 有 全 局 最 优点 在 解 空间 位 置 分 布 的 信息 ， 因 此 
希望 算法 的 搜索 种 群 能 够 均匀 地 分 散在 解 空间 。 这 样 可 以 降低 发 生 过 早 
收敛 的 可 能 性 ; 而 采用 蚁 群 算法 中 “信息 量 留存 ”的 思想 ， 可 保证 算 
法 能 够 快速 收敛 到 具有 最 优 (次 优 ) 解 的 子 空间 。 算 法 设计 如 下 。 
将 全 局 优化 问题 定义 如 下 : 
max f (x) (6.25) 
st lsx<u 
其 中 , x = (n. 和，…， x). Bi, 的 定义 域 为 [L, uds 1 = 
{hy hy cs Lb um (usus ns uu) f(x) 表示 目标 西数 ，n HH 
数 。 改 进 后 的 连续 域 蚁 群 遗 传 算法 的 主要 步骤 如 下 。 
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QD 将 解 空间 按 一 定 的 原则 分 解 成 若干 子 空 间 

针对 全 局 最 优 问题 的 维 数 和 每 一 维 定义 域 的 大 小 对 解 空间 加 以 分 
解 。 这 里 以 二 维 优化 问题 为 例 , 设 x = {x,，,*,}， 其 定义 域 分 别 为 
[2 ，u] 和 [2 ，w,] ， 定 义 域 均匀 地 分 解 为 M xN AFEN E; Hp is 
1, 2, +, M, j =1，2，…，N， 且 子 区 域 的 区 间 长 度 为 


u, -l, 


Das 
(6.26) 
u, -h 
D, = 一 
所 ,的 左右 边界 分 别 为 us yA tus tue BVA 
ayy =h +(i-1)Dy 
a =h *G-1)D, 
xy =l, + (j -1)D, (6.27) 


xi =h iD, 

xyg =l, +jDy, 

Q) 确定 初始 种 群 并 标定 各 个 子 空间 
a. 初始 种 群 的 产生 : 在 第 (1) 步 中 确定 的 每 个 子 空间 中 随机 产生 
一 个 个 体 ， 所 有 个 体 组 成 初始 种 群 。 与 子 空间 Es 相对 应 的 个 体 定义 为 
A,(1)， 括 号 中 的 1 表示 整个 算法 的 第 一 代 个 体 ， 则 初始 种 群 可 表示 为 
{4,(1)}， 其 中 EL=1，2，…，MH,，J=1，2，…，N， 种 群 规模 为 W x N。 
b. 子 空间 的 初始 标定 : 每 个 子 空间 E, 都 由 一 个 信息 量 Ph 标定 ， 
各 个 子 空间 信息 量 的 初始 值 由 其 中 产生 的 初始 个 体 的 适应 度 值 确定 。 当 
FAQ) >0 时 ,定义 Phy(1) = CJf(4s(1))， 其 中 C, 为 根据 问题 而 设 


C. 
定 的 正常 数 ; 当 f(4s(1)) «0 BE, EX Phyl) = 6 FAA) TA ay M40 
2 a 


为 个 体 4; 的 适应 度 值 。C M C, 的 设 定 同 C, o 

@ 对 种 群 进行 蚁 群 遗 传 操作 

a 选择 操作 : 选择 操作 的 主要 目的 是 为 了 避免 基因 缺失 ， 以 提高 
全 局 收敛 性 和 计算 效率 。 蚁 群 遗 传 算法 选择 操作 的 基本 思想 是 : 第 上 代 
中 的 个 体 ! 被 选中 的 概率 是 其 个 体 适 应 度 值 和 所 处 子 空间 信息 量 的 函 
数 。 群 体 规模 为 MxN， 第 代 中 个 体 1 的 适应 度 值 为 有 4.( 有)), 个 体 / 
所 处 子 空间 的 上 一 代 中 标定 的 信息 量 为 Ph.(k-1)， 则 个 体 1 被 选中 的 
概率 为 


Phi(k - DÉFCACO) 
PAR = a ——————— — (6.28) 


Y Phick - DI'W) 
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b. 交叉 操作 ， 交叉 操作 是 故 群 遗传 算法 中 产生 新 个 体 的 主要 方法 ， 
可 以 针对 具体 问题 ， 根 据 编码 方法 的 不 同 选择 各 种 常用 的 交叉 操作 和 交 
又 概率 。 
< 变异 操作 ， 变异 操作 是 产生 新 个 休 的 辅助 方法 ， 同 时 也 决定 了 
故 群 遗传 算法 的 局 部 搜索 能 力 。 与 交叉 操作 相似 ， 可 根据 具体 问题 选取 
具体 的 变异 方法 和 变异 概率 。 
d 子 空间 信息 素 的 更 新 : 随 着 种 群 一 代 代 进 化 ， 各 子 空间 的 信息 
量 也 不 断 积累 ， 在 积累 过 程 中 必须 对 残留 的 信息 量 按照 公式 (6.29) 
进行 更 新 处 理 ， 并 根据 第 (2) 步 确定 第 一 代 中 各 子 空间 的 信息 量 。 
Phy(k) = (1 -g) Phe - 1)  PhjCE) (6.29) 
Jib, PhCO JORJR ECTS Lj EROR RS Ph,( 上 - 1) 表 示 第 上 -1 
RISH y ERRAR PHOEBE k RERET EN j EIMA 
的 信息 量 。 不 妨 设 在 子 空间 六 上 ， 第 上 代 以 前 具有 最 大 适应 度 值 的 个 体 
为 4 ， 第 上 代 选 择 、 交 叉 和 变异 操作 后 ， 具 有 最 大 适应 度 值 的 个 体 为 
Asso MUR FI BY) P fU ， 则 As = Agnes C EN, Ajoa 
AUR. HSAs) >0 时 ， 定 义 
Phi(k) = Cf( Ajmer) (6.30) 
M (Au) <0 时 ， 定 义 
c, 
PRU) = OF Apon) 
JU, C, CG, C, 为 根据 问题 而 设 定 的 正常 数 ， 且 C, > Cys S Ama) 8 
个 体 4 的 适应 度 值 。 如 果 上 代 中 革 一 子 空间 没有 个 体 ， 则 4 保持 
不 变 。 
子 空 间 六 中 具有 最 大 适应 度 值 的 个 体 hu 是 随 着 蚊 群 遗传 操作 一 
代 代 保留 下 来 的 ， 所 以 不 必 每 一 代 都 比较 六 中 所 有 个 体 的 适应 度 值 ， 只 
需 同 该 代 中 交叉 和 变异 产生 的 新 个 体 的 适应 度 值 进行 比较 即 可 。 结 合 各 
子 空间 内 的 初始 信息 量 信 ， 利 用 公式 (6.29) 可 保证 各 子 空间 内 的 信 
息 量 随 中 传 进化 而 不 断 积累 和 更 新 。 
@ 结束 
当 群 体 中 的 最 优 个 体 满足 一 定 要 求 或 总 代数 达到 一 定数 量 时 ， 结 束 
进化 操作 。 


(6.31) 


6.5 蚁 群 算法 的 典型 应 用 


以 蚁 群 算法 为 代表 的 群 智能 已 成 为 当今 分 布 式 人 工 智能 研究 的 一 个 
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热点 ， 并 越 来 越 多 地 被 应 用 于 企业 的 运转 模式 、 生 产 计 划 制 定 和 物流 管 
理 的 研究 。 从 美国 五 角 大 楼 的 “群体 战略 ” ( Swarm Strategy) ， 到 英国 
电信 公司 的 基于 电子 蚂蚁 的 电信 网 络 管理 试验 ; 从 英国 联合 利 华 公司 的 
基于 蚁 群 算法 的 生产 计划 管理 软件 ， 到 美国 太平 洋 西南 航空 公司 基于 蚁 
群 算法 的 运输 管理 软件 等 ， 很 多 政府 和 国际 著名 公司 纷纷 采用 蚁 群 算法 
等 群体 智能 技术 来 改善 其 运转 机 能 。 

当然 以 上 提 到 的 这 些 应 用 只 是 蚁 群 算法 应 用 方面 的 冰山 一 角 。 实 际 
中 ， 蚁 群 算法 在 诸多 的 领域 都 有 不 俗 的 表现 ， 如 : 旅行 商 问题 (TSP), 
指派 问题 (QAP) 、 车 辆 路 径 问 题 (VRP) 、 车 间作 业 调 度 问题 (ISP), 
电力 系统 、 控 制 参数 优化 、 参 数 辨识 、 聚 类 分 析 、 故 障 诊断 、 数 据 挖 
据 、 网 络 路 由 问题 、 机 器 人 领域 、 图 像 处 理 、 航 迹 规划 、 空 战 决 策 、 岩 
土工 程 、 化 学 工业 、 生 命 科 学 、 布 局 优化 等 。 由 于 篇 幅 所 限 ， 不 能 详尽 
介绍 ， 仅 介绍 车 辆 路 径 问 题 和 车 间作 业 调 度 问 题 ， 着 重 强调 蚁 群 算法 与 
实际 问题 的 切入 点 及 算法 的 改进 策略 。 


6.5.1 车 辆 路 径 问 题 


车 辆 路 径 问 题 ( Vehicle Routing Problem, VRP): 也 称 “ 车 辆 计 
划 ”。 即 已 知 个 客户 的 位 置 坐标 和 货物 需求 ， 在 可 供 使 用 车 辆 数量 及 
运载 能 力 条 件 的 约束 下 ， 每 辆 车 都 从 起 点 出 发 ， 完 成 若干 客户 点 的 运送 
任务 后 再 回 到 起 点 ， 要 求 以 最 少 的 车 辆 数 、 最 小 的 车 辆 总 行程 完成 货物 
的 派送 任务 。 

从 本 质 上 说 ，TSP 问题 是 VRP 问题 的 基本 问题 ， 而 VRP 的 复杂 度 
远 高 于 TSP， 应 用 蚁 群 算法 求解 VRP 与 TSP 主要 有 以 下 3 个 不 同 之 处 。 

(1) 子路 径 构 造 过 程 的 区 别 

在 TSP 中 ,每 只 蚂蚁 要 经 过 所 有 节点 ; 在 VRP 中 ,每 只 蚂蚁 不 需 
要 经 过 所 有 节点 。 因 此 ， 在 求解 VRP 的 每 次 迭代 中 ， 每 只 蚂蚁 移动 次 
数 是 不 确定 的 ， 只 能 将 是 否 已 回 到 原点 作为 路 径 构造 完成 的 标志 。 

(2) allowed, 的 区 别 

allowed, 的 确定 是 蚂蚁 构造 路 径 过 程 中 一 个 非常 关键 的 问题 。 在 
TSP 中 ， 蚂 蚁 转移 时 只 需 考虑 路 径 距 离 和 信息 量 ; 在 VRP 中 ， 蚂 蚁 转 
移 时 不 但 要 考虑 上 述 因 素 ， 还 需 考虑 车 辆 容量 的 限制 。 

(3) 可 行 解 结构 的 区 别 

在 TSP 中 ,每 只 蚂蚁 所 构造 出 来 的 路 径 均 是 一 个 可 行 解 ; 在 VRP 
中 ， 每 只 蚂蚁 所 构造 的 回路 仅 是 可 行 解 的 “ 零 部 件 ”， 各 蚂蚁 所 构造 的 
回路 可 能 能 够 组 合成 一 些 可 行 解 ， 也 可 能 一 个 可 行 解 都 得 不 到 。 因 此 ， 
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研究 如 何 设计 算法 来 尽量 避免 无 可 行 解 现象 的 出 现 以 及 如 何 获 取 可 行 解 
是 蚁 群 算法 在 VRP 领域 中 应 用 的 关键 。 

下 面 介绍 基于 改进 的 最 大 - 最 小 蚂蚁 系统 (MMAS) 的 有 时 间 窗 车 
辆 路 径 问 题 (Vehicle Routing Problem with Time Window, VRPTW), 

有 时 间 窗 车 辆 路 径 问 题 (Vehicle Routing Problem with Time Win- 
dow, VRPTW) 是 一 个 NP 完全 问题 ,许多 学 者 曾 试图 进行 求解 。 万 旭 
等 人 应 用 改进 的 最 大 - 最 小 蚁 群 算法 (Max - Min Ant System, MMAS) 
求解 VRPTW ， 利 用 其 并 行 性 与 分 布 性 ， 进 行 大 规模 启发 式 搜索 。 

VRPTW 可 以 概述 如 下 : An 个 货物 需求 点 〈 或 称 顾客 ) ， 已 知 每 
个 需求 点 的 需求 量 及 位 置 ， 用 多 辆 汽车 从 中 心 仓库 (或 配送 中 心 ) 到 
达 这 批 需求 点 。 要 求 必 须 在 它 的 时 间 窗 口内 为 每 个 客户 服务 ， 如 果 汽 车 
提前 到 了 客户 所 在 地 ， 也 必须 等 待 ， 直 到 人 允许 为 该 客户 服务 为 止 。 每 辆 
汽车 载重 量 一 定 ， 每 条 路 线 不 得 超过 汽车 载重 量 。 每 个 需求 点 的 需求 必 
须 且 只 能 由 一 辆 汽车 来 提供 ， 目 标 是 最 小 化 总 的 汽车 行驶 距离 和 所 需 的 
汽车 数目 。 文 中 将 最 小 化 汽车 总 的 行驶 路 程 作为 第 一 目标 ， 最 小 化 车 辆 
数目 作为 第 二 目标 。 

1. 算法 设计 

MMAS 与 AS 的 主要 区 别 在 于 通过 将 每 条 轨迹 上 的 信息 素 限制 在 
[resins Tal 之 间 ， 较 好 地 避免 了 搜索 面 的 局 部 停滞 (BD A BR MR) o 
显而易见 ，7。w 与 rw 的 设 定 至 关 重要 。 因 为 每 次 迭代 路 径 上 增加 的 最 


大 信息 来 为 Fn， 其 中 L(se) 为 全 局 最 好 解 路 径 的 长 度 ， 所 以 每 当 更 


新 最 好 解 时 ， 需 要 同时 更 新 r。.. 与 rws。rue* 与 信息 素 的 挥发 率 (1 -p) 
以 及 L(s*) 成 反比 ， 而 与 精英 蚂蚁 的 数量 成 正比 。 因 此 可 按 以 下 策略 动 

态 地 确定 Talt) Tail t) 0 
D 在 最 初 信息 素 还 未 得 到 更 新 时 ( 即 产 生 第 一 代 解 前 )， 采 用 式 
(6.32) AK (6.33) ME r3 rus (s 
1 H 


Tas) ^20-5) L5) (6.32) 
Taunt) D (6.33) 

@ 一 旦 信息 素 更 新 之 后 ， 采 用 式 (6.34) 确定 Talt) 
1 z (6.34) 


TCO "20 7) LP) U) 
RH, o WARM TM. Talt 的 确定 与 式 (6.33) Fo 
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(1) 最 大 -最 小 蚂蚁 算法 中 路 径 的 构造 

每 只 蚂蚁 选择 下 一 个 城市 时 ， 在 满足 车 辆 容量 和 时 间 窗 约束 的 前 提 
下 ,需要 考虑 两 个 方面 的 因素 。 

外 通 往 下 一 个 城市 的 路 径 长 度 以 及 路 径 上 信息 素 的 多 少 。 

@ 时 间 窗 因素 的 择优 性 ， 由 下 一 个 客户 j 的 时 间 窗 宽度 和 所 在 客户 
i 到 达 下 一 个 客户 j 的 时 间 等 因素 决定 。 这 种 择优 性 的 优先 原则 为 ， 需 
等 待 时 间 较 短 优先 原则 和 时 间 窗 较 小 优先 原则 。 

综合 以 上 两 方面 的 因素 ， 第 上 条 路 径 上 的 蚂蚁 在 城市 v, 选择 城市 w 
的 概率 由 式 (6.35) 决定 

1 
Cn) lt lt - bl 

Pe |" F ap > >1 


we 


0, 其 他 (6.35) 
XB, Q- dol o 为 可 被 访问 的 城市 | U Lvl, v 为 配送 中 心 (depo ; 
o, fo, HLERK, WHO<o,, ol, Ho +a =l; [aj We 
户 j 的 时 间 窗 ; 4 为 由 客户 i 到 达 客 户 j 的 时 间 ( 即 开始 为 客户 i 服务 的 时 
刻 + 客 户 i 所 需 的 服务 时 间 + 从 客户 i 到 j 的 路 程 消耗 时 间 ); a 和 8B 为 轨 
迹 上 的 信息 素 与 该 轨迹 可 见 性 的 权重 系数 ; rA v, 5 v, 之 间 轨 迹 上 的 信 


AK: ,为 轨迹 的 可 见 性 ， 这 里 取 n= 于， 为 客户 i 与 客户 /之 间 的 距 


离 。 

(2) 信息 素 的 更 新 

信息 素 的 更 新 有 局 部 更 新 和 全 局 更 新 两 种 方式 。 这 里 采用 全 局 更 新 
的 方式 ， 只 将 最 好 的 蚂蚁 用 于 信息 素 的 更 新 ， 就 是 将 在 路 径 构造 中 排名 
前 几 位 的 精英 蚂蚁 用 于 信息 素 更 新 。 更 新 规则 如 下 : 

my = (1 pty + $ Ar} + Ar (6.36) 

仅 当 轨迹 (w， 吕 被 排名 第 人 好 的 蚂 蚊 利用 时 ， 其 信息 素 才 增加 Aj 
Arys TE, L, 为 排名 为 上 的 路 径 长 度 。 所 有 属于 当前 最 好 路 径 的 轨迹 


上 的 信息 素 都 被 加 强 oA7; ， 其 中 Ar; ue L' 为 当前 最 好 解 路 径 的 


长 度 。 
这 种 信息 素 更 新 方式 收敛 速度 较 乙 ， 而 且 其 全 局 优化 性 能 也 不 明 
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显 。 为 了 加 快 其 收敛 速度 ， 同 时 又 不 影响 全 局 优化 能 力 ， 在 较 短 的 时 间 
内 找到 最 优 解 ， 这 里 提出 一 种 改进 的 信息 素 更 新 方法 。 该 方法 保留 全 局 
的 最 好 解 ， 但 为 了 扩大 信息 素 更 新 的 范围 ， 精 英 蚂蚁 取 每 次 迭代 结果 中 
的 前 几 位 ， 这 时 的 信息 素 更 新 仍然 采用 式 〈6.36) 。 在 和 迭代 过 程 中 ， 对 
出 现 优 于 上 代 解 的 本 代 解 给 予 激励 ， 对 劣 于 上 代 解 的 本 代 解 给 予 惩罚 ， 
从 而 加 快 了 其 收敛 速度 。 对 更 新 过 的 路 径 具体 激励 与 惩罚 措施 如 下 式 : 


new? uem | oew y Doe 7 aa 
Uu ST x 


(6.37) 

(3) 局 部 优化 

在 蚁 群 算法 中 混入 局 部 优化 算法 ,对 每 代 构造 的 解 进行 改进 ， 可 以 
进一步 缩短 解 路 线 的 长 度 ， 从 而 加 快 蚊 群 算法 的 收敛 速度 。 这 里 只 对 每 
代 最 好 解 进行 局 部 优化 ， 局 部 优化 作用 时 间 为 所 有 的 蚂蚁 已 经 构造 完 
解 ， 但 信息 素 还 未 更 新 之 前 。 这 里 采用 2 - opt 的 局 部 优化 方法 。 

(4) 初始 解 的 构造 

在 系统 初始 化 时 要 确定 7。,，7。. 的 值 。 确 定 它们 的 值 首先 要 明确 
L(s*) 的 值 ， 所 以 在 最 初 就 必须 有 一 个 较 好 的 可 行 解 。 由 于 VRPTW 的 
复杂 性 ， 产 生 一 个 可 行 的 初始 解 不 是 一 件 容易 的 事情 。 这 里 采用 一 种 基 
于 客户 时 间 窗 下 限 较 小 优先 的 快速 产生 初始 解 的 算法 ， 其 时 间 复 杂 度 为 
OClogin) ， 明 显 快 于 节约 法 0(n')。 该 算法 选择 下 一 个 客户 的 策略 
为 ， 从 当前 路 径 的 最 后 一 个 客户 出 发 ， 到 所 有 未 访问 过 的 客户 中 开始 服 
务 时 间 最 早 的 那个 客户 。 只 有 当 开 始 服务 时 间 超 过 这 个 客户 的 时 间 窗 
时 ， 才 需要 新 开辟 一 条 路 径 ， 并 从 未 访问 过 的 客户 中 重新 选择 出 发 点 ， 
将 所 有 未 访问 过 的 客户 中 开始 服务 时 间 最 早 的 那个 客户 作为 新 路 径 的 第 
一 个 客户 。 算 法 描述 如 下 : 


第 1 步 : 初始 化 。 
第 2 步 : 将 所 有 未 被 访问 过 的 客户 放 人 集合 C 中 。 
第 3 步 : C = {eo s Gis om Gs ns 64a C 中 的 元 素 按 如 


下 规则 有 序 排列 : 对 任意 的 i<j， WEW (c;， 当 前 路 径 R 的 最 后 一 个 
客户 ) <W(c,， 当 前 路 径 R 的 最 后 一 个 客户 ); 令 k=1。 

Ag: 如 果 集 合 C 为 空 ， 转 第 7 步 。 

第 5 步 : 如 果 W(o, c) =T, RENE R 重新 开辟 一 条 路 
径 ， 从 当前 未 被 访问 的 客户 中 随机 选择 一 个 客户 c, 作为 新 路 径 的 出 发 
Rm, C=C-c,; 转 第 3 步 。 

第 6 步 : 如 果 客 户 ct 为 当前 路 径 R 的 合法 客户 ,将 ce 加 入 当前 路 
RHP; C=C-c; k=k+1; 转 第 4 步 。 
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第 7 步 : 输出 计算 结果 ， 程 序 结束 。 
rh, Woe, e) 的 返回 值 为 max(c。 的 开始 服务 时 间 + c。 的 服务 所 需 
时 间 + 从 c, 到 c, 的 行驶 时 间 4a)。 若 到 达 c, 的 时 间 晚 于 bas DU 
有 (ci ，co) 返 回 一 个 很 大 的 了 值 ， 表 示 该 客户 不 能 加 入 路 径 。 

2. RAD 

将 以 上 改进 的 MMAS 算法 应 用 于 Marius 在 文献 中 所 述 的 基准 
VRPTW 实例 ， 这 些 实例 共 56 个 。 这 56 个 实例 中 的 每 个 例子 都 含有 
100 个 客户 和 一 个 中 心 仓 库 ， 并 规定 了 车 辆 负载 、 客 户 的 时 间 窗 和 车 辆 
运行 时 间 。 实 例 分 为 6 大 类 ， 其 中 RI 和 R 中 的 客户 为 随机 分 布 ，C1 
和 C2 中 的 客户 有 聚集 趋势 ，RC1 和 RC 的 客户 兼 有 R 类 和 C 类 的 
特征 。 

实验 开始 ， 在 每 个 城市 都 放置 一 只 蚂蚁 ， 蚂 蚁 的 个 数 与 客户 的 数目 
相同 。 设置 c =1.0，B =5.0; 信息 素 挥发 系数 p 取 值 在 0.02 到 0.3 之 
li; o 的 取 值 一 般 在 3 ~6 之 间 较 合适 ; e, Mo, 的 设 定 需 根据 具体 情 
况 而 定 ， 一 般 来 说 ，0.5 <w, «1.0, 0 <w, «0.5, 路径 上 信息 素 初始 化 
A Tuo 

在 MMAS 中 ， 一般 将 路 径 上 的 信息 素 初 始 化 为 上 限 值 re， 这 样 可 
使 系统 具有 更 好 的 全 局 搜索 能 力 。 为 了 说 明 这 样 做 的 好 处 ， 这 里 将 分 别 
初始 化 为 rs 和 7 的 结果 做 了 对 比 ， 如 图 6.7 所 示 。 图 6.7 分 别 描述 
了 这 两 种 情况 下 对 实例 RC101 所 做 实验 中 迭代 次 数 与 获得 第 一 目标 最 
好 解 的 关系 ， 可 以 看 出 初始 化 为 上 限 值 虽 收敛 较 慢 , 但 可 获得 更 好 的 
解 。 其 中 DV 表示 偏离 最 优 目 标 已 知 最 优 解 的 百分比 ，N 表示 迭代 次 
数 。 表 6.3 中 比较 了 原来 的 MMAS 与 改进 后 的 MMAS。 很 明显 ， 采 用 改 
进 后 的 信息 素 更 新 方式 会 有 更 快 的 收敛 速 度 和 更 好 的 结果 。 


DV (%) 


图 6.7 {AB RWW T uH Tan HARM EG 
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图 6. 8 描述 了 在 实例 RC102 中 获得 的 第 一 目标 值 与 CPU 运行 时 间 
的 关系 。 从 图 中 可 以 看 出 ， 算 法 在 运行 初期 就 能 使 当前 解 得 到 很 好 的 改 
善 ， 并且 收敛 速度 较 快 。 实 验 结果 与 当前 已 知 最 优 解 的 比较 见 表 6.4， 
改进 后 MMAS 的 平均 值 为 对 某 一 实例 进行 10 次 实验 所 得 解 的 平均 。 表 


6.4 中 给 出 的 解 分 为 两 部 分 ，“/” 之 前 为 第 一 目标 值 ， 
二 目标 值 。 
2230 
2060 
1950 
1870 
1790 
1710 
10 90 170 250 330 410 490 
运行 时 间 /s 


图 6.8 获得 的 第 一 目标 值 与 CPU 运行 时 间 之 间 的 关系 


表 6.3 MMAS 获得 的 最 好 结果 与 历经 的 迭代 次 数 


“/” 之 后 为 第 


OO 


未 改进 的 MMAS 改进 后 的 MMAS 
=n DV(% ) N DV(% ) N 
RC201 2.4 64 0.7 51 
RC203 2.3 57 1.3 48 
RC205 2.3 69 1.1 63 
RC207 2.6 55 1.0 53 
C202 2.2 54 1.3 54 
C204 1.9 67 1.0 62 
C206 2.5 68 1.4 64 
C208 2.3 58 0.9 57 
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6.4 改进 后 MMAS 的 平均 值 及 实际 最 优 值 与 已 知 最 优 值 的 比较 


— 
实例 R101 R102 R103 R104 R105 R106 


已 知 | 1650. 80/19 | 1486. 12/17 | 1292. 68/13 | 1007. 31/9 | 1377. 11/14 | 1252. 03/12 


平均 | 1701. 58/18 | 1554. 91/17 | 1338. 57/13 | 1050. 72/9 | 1412. 14/13 | 1303. 61/12 


实际 | 1660. 71/18 | 1503. 47/17 | 1307. 74/13 | 1032. 29/9 | 1374. 03/13 | 1266. 74/12 


实例 R107 R108 R109 R110 R111 R112 


已 知 | 1104. 66/10 | 963. 99/9 |1194. 73/11 | 1124. 40/10 | 1096. 72/10 | 982. 14/9 


平均 |1148. 15/10 | 1002. 17/9 |1247. 32/11 | 1161. 25/10 | 1133. 94/10 | 1025. 88/9 


实际 |1121. 94/10 | 979. 64/9 |1217. 09/11 | 1155. 43/10 | 1120. 57/10 | 1004. 71/9 
LLL 


由 表 6.4 可 见 ， 改 进 的 MMAS 的 最 好 解 已 经 很 接近 最 优 解 ， 个 别 
实例 (如 实例 RIO 和 实例 RI105) 的 第 二 目标 值 还 优 于 当前 最 好 解 ， 
说 明 采 用 MMAS 解决 VRPTW 是 非常 有 效 的 。 该 系统 有 如 下 优点 : 

Orth MMAS 可 以 方便 地 解决 其 他 车 辆 路 径 问 题 ， 若 没有 时 间 
窗 的 VRP， 只 需 将 o, 设 为 0 即 可 。 

@ 改 进 的 MMAS 可 被 用 于 多 供 货 点 VRP 问题 (VRP with Multi ~ 
Depot) 。 

图 通过 实时 设 定 某 条 路 径 上 信息 素 的 上 下 限 ， 可 以 将 其 用 于 动态 实 
时 的 VRP。 


6.5.2. 车 间作 业 调 度 问 题 


车 间作 业 调 度 (Job - shop Scheduling Problem，JSP) 主要 是 针对 一 
项 可 分 解 的 工作 (如 生产 制造 )， 探 讨 在 尽 可 能 满足 约束 条 件 (如 交 货 
期 、 工 艺 路 线 、 资 源 状况 ) 的 前 提 下 ,通过 下 达 生 产 指令 ,安排 其 组 成 
部 分 (操作 ) 使 用 哪些 资源 、 其 加 工时 间 及 加 工 的 先后 顺序 ， 以 获得 产 
品 制造 时 间或 成 本 的 优化 。JSP 问题 是 典型 的 NP - hard 问题 ， 目 前 已 成 
为 CIMS 领域 内 的 重要 研究 课题 。JSP 问题 的 特征 模型 可 描述 如 下 : 

@ 存 在 j 个 工作 (job) 和 m 台 机 器 (Machine) 。 

@ 每 个 工作 由 一 系列 操作 (或 者 任务 /Task/Operation) 组 成 。 

图 操作 的 执行 次 序 遵循 严格 的 串 行 顺序 。 

@ 在 特定 时 间 ， 每 个 操作 需要 一 台 特定 机 器 完成 。 

加 每 台 机 器 在 同一 时 刻 不 能 同时 完成 不 同 的 工作 。 

@@ 同 一 时 刻 ， 同 一 工作 的 各 个 操作 不 能 并 发 执行 。 

@ 问 题 是 如 何 求 得 从 第 一 个 操作 开始 到 最 后 一 个 操作 结束 的 最 小 时 
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间 间 隔 (Makespan) 。 

1. 蚊 群 算法 与 混流 装配 线 调度 

混流 装配 线 (Sequencing Mixed Models on Assembly Line, SMMAL) 
是 JIT 生产 方式 的 具体 应 用 之 一 ， 它 可 以 在 不 增加 产品 库存 的 条 件 下 满 
足 用 户 的 多 样 化 需求 。 所 谓 混流 装配 线 ， 是 指 在 一 定时 间 内 ， 在 一 条 生 
产 线 上 生产 出 多 种 不 同型 号 的 产品 ， 产 品 的 品种 可 以 随 顾客 需求 的 变化 
而 变化 。 

(1) 算法 设计 

采用 丰田 公司 提出 的 调度 目标 函数 ， 以 汽车 组 装 为 例 ， 即 在 组 装 所 
有 车 辆 的 过 程 中 ， 所 确定 的 组 装 顺序 应 使 各 零 部 件 的 使 用 速率 均匀 化 。 
如 果 不 同 型 号 的 汽车 消耗 零 部 件 的 种 类 大 致 相同 。 那 么 原 问题 可 简化 为 
单 级 SMMAL。 则 问题 可 描述 为 


min 》 Y 5 Cha, - b, - Bia x, (6.38) 
j=l imi pat 

ELO 车 型 i 在 调度 中 的 j 位 置 (6.39) 

a 其 他 


Xa 
P =— D 
其 中 ,i 表示 车 型 数 的 标号 ; n 表示 需要 装配 的 车 型 数 ; m 表示 装配 线 
上 需要 的 零 部 件 种 类 总 数 ; p 表示 生产 调度 中 子 装配 的 标号 ; j 表示 车 
型 调度 结果 ( 即 排序 位 置 ) 的 标号 ; D 表示 在 一 个 生产 循环 中 需要 组 
装 的 各 种 车 型 的 总 和 ; d, 表示 在 一 个 生产 循环 中 车 型 i 的 数量 ; bw 表示 
生产 每 辆 i 车 型 需要 零 部 件 p 的 数量 ; a, 表示 零 部 件 p 的 理想 使 用 速 
率 ; Bj-1,, 表 示 组 装 线 调度 中 前 j - 1 台 车 消耗 零 部 件 p 的 数量 和 ， 为 
B,7B,.., *xB,. KP Bo, =0 (6.41) 
调度 的 目标 函数 如 式 (6.38) 所 示 ， 采 用 如 图 6.9 所 示 的 搜索 空 
间 定义 ， 列 表示 排序 阶段 〈 用 表示) ， 行 表示 每 个 阶段 可 供 选择 的 车 
型 (用 i 表示 ) ， 圆 图 的 大 小 表示 选择 概率 的 大 小 ， 蚁 群 算法 就 是 不 断 
改变 圆 图 的 大 小 ， 最 终 寻 找到 满意 的 可 行 解 。 举 例 说 明 混 流 装 配 线 排序 
搜索 空间 的 例子 。 有 3 种 车 型 A、B、C 排序 ， 每 个 生产 循环 需 A 车 型 
3 辆 ，B 车 型 2 辆 ，C 车 型 1 辆 ， 则 每 个 循环 共 需 生产 6 辆 车 (D =6) 。 
列表 示 6 个 排序 阶段 ， 行 表示 有 3 种 车 型 可 以 选择 。 图 6.9 (a) 所 示 
的 是 搜索 的 初始 状态 ， 圆 图 由 局 部 搜索 值 和 激素 综合 而 成 , 图 6.9 (b) X 
示 经 过 若干 次 迭代 之 后 ， 搜 索 空间 变化 。 这 时 候 ， 最 可 能 的 可 行 解 是 
B-A-C-A-B-A。 利 用 这 种 表示 方法 可 以 降低 问题 描述 的 维 数 ， 该 


a, 


(6. 40) 
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问题 规模 为 0(n* m) ， 其 中 n 是 车 型 数 ，m 是 排序 长 度 。 


PP YA WR PP 


i Y Y 


oj olo ooo o oo A Ko 
i X i WW Ox. y, V PX (OO 
从 
in M i ^ IA 
Ag ^ A 内 ‘oe Oo pi AN, IN o US 


(a) OOo: Co) 搜索 空间 变化 
图 6.9 简单 SMMAL 排序 的 搜索 空间 举例 
@D 局 部 搜索 的 计算 
aps g (6.42) 


CI ^ m 

È 2 È a-b, - Ba *u 
其 中 , 大 表示 第 上 只 蚂蚁 ; Q 是 一 个 常数 ， 调 节 ,的 大 小 。 局 部 搜索 m, 
采用 贪 焚 法 〈 与 目标 追随 法 一 致 ) 。 目 标 追 随 法 的 思路 是 ， 每 一 步 均 从 
当前 可 选择 策略 中 选取 ， 使 目标 函数 值 增 加 最 少 的 策略 ， 即 在 确定 第 
n+1 台 车 辆 的 车 型 时 ， 如 有 多 种 车 型 可 供 选 择 ， 则 从 中 选择 一 种 车 型 ， 
使 第 n+1 台 车 辆 组 装 时 各 零 部 件 的 使 用 速率 最 均匀 。 若 每 步 只 考虑 当 
前 的 状态 ， 而 不 考虑 全 局 状态 ， 这 样 得 到 的 结果 常常 为 局 部 最 优 解 。 但 
是 蚁 群 算法 为 每 一 个 可 选择 的 车 型 ;计算 %， 最 后 再 结合 信息 素 的 作 
用 ， 再 做 出 车 型 的 选择 。 


Qu S SEE RUE 
状态 转移 概率 公式 
eh y g tabin 
ps(t) = » (ar, + (1 - a) ny) (6. 43) 
0, 其 他 


其 中 ，a 表示 信息 素 的 相对 重要 性 ; 7,(t) 在 1 时刻, i 车 型 放置 在 7 位 
次 上 信息 激素 的 数量 ; 7s 是 当 j - 1 个 车 型 顺序 排 定 后 ， 将 让 车 型 放置 在 
j 位 次 上 目标 函数 的 值 ; tabu (1) 表示 存放 在 +t 时刻， 第 k 只 蚂蚁 不 可 以 
走 的 节点 ; p ORRE A, 第 k 只 蚂蚁 选择 将 i 车 型 放置 在 j 位 次 
上 的 概率 。 

@@ 信 息 素 更 新 规则 
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e Dn us] 车 型 ;在 调度 中 的 了 位置 
0, 其 他 

其 中 ，Ar! 表 示 在 时刻， 第 上 只 蚂蚁 在 ;车 型 /位 次 上 放置 的 信息 激 
Ks LB 表示 目标 函数 的 下 限 值 ，Z 表示 目前 目标 函数 的 平均 值 ，Z。 是 
当前 的 目标 函数 值 。 这 种 动态 标记 的 方法 可 以 在 搜索 的 过 程 中 加 大 可 行 
解 间 信息 激素 的 差别 ， 避 免 过 早 的 收敛 ， 如 图 6. 10 所 示 。 


(6.44) 


图 6.10 线性 动态 标注 


nant 


Ti Ary = Y Ary。 因 此 可 将 信息 素 更 新 策略 表示 为 
- 


Ty(t+n) 2 (1 7p) * 7y(t) + Ar, (6.45) 

RP, p 表示 信息 激素 的 消散 速率 。 

(2) 算 例 分 析 

这 里 采用 文献 [30] 中 的 算 例 数据 ， 见 表 6.5。 经 过 多 种 组 合 试验 ， 
得 到 蚁 群 算法 最 优 组 合 参数 为 p=0.9,，a =0.2，@ 220000, Nin, =400， 
n=5, 目标 函 数值 2 859.8, ， 排 序 结果 为 C-A-D-E-B-A-D-E- 
A-C-A-B-E-D-A-C。 表 6.6 列 出 了 文中 的 蚁 群 算法 与 文献 中 给 
出 的 目标 追随 法 、 遗 传 算法 和 模拟 退火 算法 的 比较 结果 ， 蚁 群 算法 的 求 
解 性 能 优 于 其 他 启发 式 算法 。 

ROS 各 种 车 型 的 物料 单 和 需求 的 子 装配 数 


NEL FRR 
产 的 各 种 车 型 数 | x |n |n |a |x [x i sin [nix 
A s 0 17 9 0 4 0 0 18 0 0 
十 
B 2 12. | 13 0 1 0 0 0 1 17 | 17 
€ 3 2 4 0 19 0 12 6 4 9 3 


6.5 蚊 群 算法 的 典型 应 用 209 
续 表 
车 型 每 个 生产 循环 生 T 装配 
产 的 各 种 车 型 数 | s | =: | =: | x xs | Tx | | x, | 
D 3 0|1|0 |19| 0 | 15| 9 | 9|o[6 
E 3 0|0|5|7|8]|10|4 | ojojo 
FEE MAER 30 |168 | 60 | 157 | 44 |111 | 57 |131 | 61 | 61 
的 子 装配 数 
表 6.6 六 群 算法 与 其 他 启发 式 算法 的 对 比 
算法 名 称 目标 函数 结果 改善 的 百分比 (9) 
目标 追随 法 3293 13 
遗传 算法 3073 6 
模拟 退火 算法 3162 10 
蚁 群 算法 2859.8 - 


2. 双向 收敛 蚁 群 算法 与 车 间作 业 调 度 
为 了 合理 高 效 地 调度 资源 ， 解 决 组 合 优化 问题 ， 在 Job - Shop 问题 

图 形 化 定义 的 基础 上 ， 借 鉴 精英 策略 的 思路 ， 提 出 使 用 多 种 挥发 方式 的 
双向 收敛 蚁 群 算法 ， 提 高 了 算法 的 效率 和 可 用 性 。 
为 了 便于 比较 双向 收敛 蚁 群 算法 与 基本 蚁 群 算法 求解 JSP 的 性 能 
采用 Muth 和 Thompson 在 1963 年 提出 的 Job - Shop 6 x 6 基准 问题 ， 见 
表 6.7 ( 表 中 上 表示 任务 所 需 时 间 ) 。 
3: 6.7 Muth & Thompson 6 x 6 基准 问题 


—_— 
项 目 m,t m,t m,t m,t m, t m, t 
Job, 3,1 $3. 2,6 4,7 6,3 5,6 
Job, 2,8 y 5, 10 6, 10 1, 10 4,4 
lob, 3,5 4,4 6,8 1,9 2,1 5,7 
Job, 2,5 v5 3.5 4,3 5,8 6,9 
Job, 3,9 2,3 3:5 6,4 1,3 4,1 
Job, 2,3 4,3 6,9 | 1, 10 5,4 3,1 
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表 6.7 rh, Job, 的 第 一 个 任务 Task, 需 在 Machine, 上 完成 ， 历 时 1 
个 时 间 单 位 ; 第 二 个 任务 Task, 在 Machine, 上 完成 ， 历 时 3 个 时 间 单 
位 ， 以 此 类 推 。Job 中 的 后 续 任 务 不 能 在 前 面 任务 完成 之 前 启动 。 求 解 
Job - Shop 问题 ， 就 是 针对 每 一 个 Machine， 调 度 其 上 的 任务 次 序 。 上 
述 问 题 使 用 矩阵 表示 如 式 (6.46) ~R (6.47). 

SARE T 表示 每 个 工作 的 任务 调度 顺序 ,矩阵 己 表 示 相 应 的 时 间 间 
隔 。 采 用 文献 [7] 中 的 定义 方法 ， 将 以 上 问题 转换 成 如 图 6. 11 所 示 
的 结构 。 

m, m, m, m, m, ms 
m, m, m, m, m, m, 
m, m, m, m, m, m, 


T- (6.46) 


m, m, m,m, m, m, 


P= (6.47) 


图 6.11 JSP 的 图 形 化 定义 


图 6. 11 所 示 的 结构 由 37 个 节点 组 成 ， 增 加 了 一 个 虚拟 起 点 0， 从 
点 0 开始 可 以 提供 通 往 Job,, Job,, =, Job, 的 单 向 通路 ， 此 外 的 节点 
P,(1«i, j<6) 表示 Machine 矩阵 T 中 相应 位 置 的 点 ， 即 7 中 的 
Machine 代 号 。 因 此 ， 图 6. 11 中 的 第 i 行 ( 除 起 始点 0 以 外 ) 表示 表 
6.7 中 的 第 i 个 Job。 每 个 工作 内 的 各 个 任务 由 有 向 弧 连 接 ， 各 个 工作 之 
间 的 任务 由 无 向 弧 连接 。 
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对 图 6. 11 所 示 的 图 结构 作 如 下 定义 。 
定义 6.4 (操作 Operation) : 操作 用 节点 表示 ， 定 义 操作 为 
Operation = (sTime, eTime, isDone, NEXT) 

其 中 ，sTime 和 eTime 分 别 是 本 操作 的 开始 和 结束 时 间 ; isDone 表示 本 
节点 代表 的 操作 是 否 已 经 完成 ， 或 者 蚂蚁 是 否 已 经 走 过 节 点 ;NEXT 表 
示 下 一 步 的 结构 ， 包 含 了 从 本 节点 能 够 到 达 的 节点 表 和 到 达 这 些 节 点 的 
路 径 上 信息 素 的 数量 表 。 

定义 6.5 (图 Graph) : 图 为 操作 的 集合 

Graph = (Operation, Machine) 

Jtr, Machine 为 表 6.7 中 表示 操作 所 占用 的 机 器 的 矩阵 。 在 Operation 
节点 中 已 经 包含 节点 之 间 的 连接 ， 因 此 不 需要 定义 节点 之 间 的 关系 。 

定义 6.6 (虚拟 起 始点 Start Point: ) 

StartPoint = (NEXT, nextMachine) 

虚拟 起 始点 只 连接 每 个 工作 的 第 一 个 操作 。 操 作 所 占用 的 时 间 从 NEXT 
结构 中 的 Operation 体现 ， 因 此 虚拟 起 始点 不 占用 操作 时 间 。 

(1) 算法 设计 

双向 收敛 蚁 群 算法 ， 将 历史 最 差 解 看 作 目 前 不 可 接受 的 解 ， 对 其 进 
行 惩罚 ， 可 以 引导 其 他 蚂蚁 尽量 远离 历史 最 差 解 ， 放 弃 将 最 差 解 的 组 成 
部 分 组 合成 其 他 解 的 机 会 ， 从 而 加 速算 法 的 收敛 。 下 面具 体 介绍 该 算法 。 

@@ 生 成 一 代 蚂蚁 

根据 算法 规定 的 数量 放出 蚂蚁 ， 为 保证 操作 符合 工作 的 调度 顺序 ， 
在 每 只 蚂蚁 寻 找 路 径 的 过 程 中 ， 首 先 判断 目的 节点 的 前 驱 是 否 已 经 完 
成 ， 在 前 驱 已 经 完成 并 且 本 身 尚 未 完成 的 所 有 节点 中 ， 使 用 信息 素 的 浓 
度 作为 概率 选取 下 一 步 目 标 。 在 目标 的 选取 过 程 中 ， 借 鉴 遗 传 算法 中 常 
见 的 轮 盘 方法 (Roulette Wheel) 决定 。 为 保证 蚂蚁 遍历 的 次 序 符合 Job 
操作 的 次 序 要 求 ， 使 用 下 列 原则 : 

a. Job 中 同一 行 的 节点 完成 后 不 能 直接 转向 自己 的 非 直 接 后 继 点 。 

b. 使 用 评价 函数 计算 经 过 的 路 径 代表 的 时 间 间 隔 Makespan 时 ， 遵 
守 任 务 的 先后 次 序 ， 使 蚂蚁 行走 时 路 径 不 代表 任务 次 序 。 

c. 次 序 的 含义 在 计算 Makespan 时 被 加 到 路 径 上 。 

在 双向 收敛 的 蚁 群 算法 中 ,蚂蚁 无 需 每 走出 一 步 都 对 下 一 步 的 机 器 
占用 和 工序 次 序 做 判断 ， 大 大 降低 了 计算 量 ， 提 高 了 算法 的 效率 。 同 
时 ， 算 法 在 计算 状态 转移 概率 的 过 程 中 ， 不 按照 传统 的 方法 将 路 径 长 度 
考虑 在 内 。 假 定 蚂蚁 行走 的 过 程 中 不 会 重复 已 经 走 过 的 路 径 ， 蚂 蚁 选择 
下 一 条 可 能 路 径 的 状态 转换 规则 是 
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T(t) 


je alios 


py(t) = (6.48) 
加 评价 和 激励 
当 本 代 蚁 群 中 的 所 有 蚂蚁 完成 对 有 向 图 中 所 有 点 的 遍历 后 ， 使 用 评 
价 函 数 对 得 到 的 所 有 路 径 进行 评价 ， 并 按 以 下 规则 更 新 信息 素 : 
Ty(t+At)=(1-p)7s(t) +Ars(t+At) (6.49) 
其 中 , R (6.49) H8 — BIRRE- IC BGE CSE PUR FUN 
的 挥发 ， 初 始 状态 的 信息 素 随机 给 出 ; 第 二 部 分 表示 信息 素 的 修改 ， 计 
算 公 式 为 


FT bestRoady’ ^*^ 过 程 中 的 最 优 值 
Ari(t+At) = -FRR ton 过程 中 的 最 差 值 (6.50) 
0, 其 他 情况 


其 中 ，@ 表示 单位 路 径 上 的 信息 量 ; @' 表 示 单 位 路 径 上 的 用 于 惩罚 最 差 
值 的 信息 量 ; O Bean BB ETF K 

基本 ACO 使 用 参数 调节 的 方法 避免 算法 陷入 局 部 最 优 ， 这 种 方法 
取决 于 具体 的 参数 数值 ， 往 往 导 致 一 套 参数 对 应 于 一 个 具体 问题 ， 降 低 
了 算法 的 通用 性 。 而 双向 收敛 蚁 群 算法 从 两 个 方向 进行 反馈 ， 很 大 程度 
上 避免 了 对 参数 的 依赖 ， 同 时 加 快 了 算法 的 收敛 。 

图 循环 执行 

如 果 已 经 收敛 于 最 优 值 或 者 到 达 最 大 蚂蚁 代数 ， 退 出 循环 并 输出 算 
法 结果 ; 否则 ， 跳 转 步骤 @。 

图 评价 函数 

评价 函数 的 基本 思路 是 : 规定 每 只 蚂蚁 经 过 的 路 径 中 ， 前 面 节点 的 
开始 时 间 不 会 落 在 后 面 节 点 之 后 。 由 于 蚂蚁 在 寻 径 过 程 中 已 经 考虑 到 了 
操作 在 工作 中 的 先后 次 序 ， 结 果 中 的 节点 串 将 表示 不 同 工 作 的 时 间 次 
序 。 具 体 算法 如 下 : 

求 时 间 间 隔 Makespan 

// 初 始 化 第 一 个 操作 的 时 间 

O,. startTime =0; 

01. endTime = 0, executeTime; 

MO,. Time = 0,. endTime; 

Makespan =0; 

For(int i=2; i< =m- n; i+ +)// 根 据 蚂蚁 的 路 径 找 到 相应 操作 
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的 起 止 时 间 
{ 
O,, startTime = 0, _,. endTime; // 本 次 操作 只 能 在 前 面 操作 已 经 完 
成 的 情况 下 执行 
找到 0, 对 应 的 机 器 Mus 
if( M,,. Time > 0,. startTime) then// 如 果 这 时 机 器 被 占用 
0,，startTime =M,,. Time; // 等 机 器 释放 后 开始 
0,. endTime = 0,. startTime + 0,. executeTime; 
M,,. Time = 0,. endTime; 
| 
for(int j=1; j< =NumberOfMachine; j+ +)// 求 出 完成 所 有 工作 所 
需 时 间 
{ 
if Makespan < M,. Time then Makespan = M,. Time; 
l 
使 用 双向 收敛 蚁 群 算法 可 以 求 出 每 只 蚂蚁 遍历 图 的 所 有 节点 之 后 得 
出 的 Job - Shop 的 解 。 根 据 这 个 解 ， 对 所 有 蚂蚁 路 径 中 最 优 的 一 条 和 最 
差 的 一 条 使 用 式 (6.50) 改变 信息 素 。 
(2) 算 例 分 析 
这 里 采用 Muth I Thompson 的 6 x6 基准 问题 作为 仿真 算 例 。 表 6. 8 
比较 了 双向 收敛 蚁 群 算法 和 基本 蚁 群 算法 所 得 到 的 解 ， 所 得 结果 为 5 次 
求解 后 的 平均 值 。 
表 6.8 双向 收敛 蚁 群 算法 和 基本 蚁 群 算法 最 优 解 的 比较 
算法 类 型 ”| 蚂蚁 数目 | 循环 次 数 [SRA] p [umae 
基本 蚁 群 算法 | 36 | 300 108 000 | 0.010 55 


双向 收敛 蚁 群 算法 | 200 311 62 200 0.017 55 


由 表 6. 8 可 见 ， 双 向 收敛 蚁 群 算法 使 用 了 较 多 蚂蚁 进行 并 行 搜索 ， 
提高 了 搜索 过 程 的 挥发 系数 ， 从 而 在 较 少 的 代数 中 得 到 了 JSP 的 解 。 


问题 与 思考 


1. 根据 基本 蚁 群 算法 (AS) 的 程序 结构 流程 写 出 基本 蚁 群 算法 的 伪 码 表示 。 
2. 对 基本 蚁 群 算法 进行 空间 复杂 度 分 析 。 
3. 比较 AS (基本 上 蚁 群 算法 ) 5 ACS (WEWE), MMAS (最 大 - 最 小 蚁 群 
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算法 ) 的 异同 ， 并 在 计算 机 上 实现 以 上 三 种 算法 。 

4. 在 思考 题 3 的 基础 上 ， 通 过 实验 分 析 信息 素 7 和 启发 式 因子 mn, 对 蚁 群 算法 
性 能 的 影响 ; 并 改变 参数 a, B, p,m，Q 的 大 小 ,分析 其 对 蚁 群 算法 性 能 的 影响 。 

5. 多 旅行 商 问 题 ， 给 定 n 个 城市 的 集合 ，m 个 旅行 商 从 不 同城 市 出 发 ， 分 别 
走 一 条 旅行 路 线 ， 使 得 每 个 城市 有 且 仅 有 一 个 旅行 商 经 过 ,使 总 旅行 路 程 最 短 。 试 
为 该 问题 设计 编码 方案 ,并 按 最 大 - 最 小 蚁 群 算法 (MMAS) 设计 求解 问题 的 方 
法 。 要 求 写 明 状 态 转 移 概率 ， 信 息 素 的 更 新 策略 ， 并 夯 程 序 框图 。 

6. 工作 指派 问题 简 述 如 下 : n 个 工作 可 以 由 个 工人 分 别 完成 。 工 人 i 完成 工 
作 j 的 时 间 为 由 。 问 如 何 安排 可 使 总 工作 时 间 达 到 极 小 。 建 立 数学 模型 ， 并 按 蚊 群 
算法 设计 求解 问题 的 算法 。 要 求 写 明 状态 转移 概率 ， 信 息 素 的 更 新 策略 ， 画 出 程序 
框图 。 
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7.1 导 言 


James Kennedy 和 Russell Eberhart 在 1995 年 的 IEEE International 
Conference on Neural Networks 和 6" International Symposium on Micromach- 
ine and Human Science 上 分 别 发 表 了 “Particle swarm optimization" 和 
“A new optimizer using particle swarm theory” 的 论文 ， 标 志 着 粒子 群 优 
化 (Particle Swarm Optimization, PSO) 算法 的 诞生 。 国 内 也 有 人 译 为 微 
粒 群 算法 。 

粒子 群 优化 由 于 其 算法 的 简单 ， 易 于 实现 ， 无 需 梯 度 信 息 ， 参 数 少 
等 特点 在 连续 优化 问题 和 离散 优化 问题 中 都 表现 出 良好 的 效果 ， 特 别 是 
因为 其 天 然 的 实数 编码 特点 适合 于 处 理 实 优化 问题 。 近 年 来 成 为 国际 上 
智能 优化 领域 研究 的 热门 。 在 算法 的 理论 研究 方面 ， 有 部 分 研究 者 对 算 
法 的 收敛 性 进行 了 分 析 ， 更 多 的 研究 者 致力 于 研究 算法 的 结构 和 性 能 改 
善 ， 包 括 参 数 分 析 ， 拓 扑 结构 ， 粒 子 多样 性 保持 ， 算 法 融合 和 性 能 比较 
等 。 粒 子 群 优化 算法 最 早 应 用 于 非 线性 连续 函数 的 优化 和 神经 元 网 络 的 
训练 ， 后 来 也 被 用 于 解决 约束 优化 问题 、 多 目标 优化 问题 、 动 态 优化 问 
题 等 。 在 数据 分 类 、 数 据 聚 类 、 模 式 识 别 、 电 信 QoS 管理 、 生 物 系统 
建 模 、 流 程 规划 、 信 号 处 理 、 机 器 人 控制 、 决 策 支持 以 及 仿真 和 系统 辨 
识 等 方面 ， 都 表现 出 良好 的 应 用 前 景 。 国 内 也 有 越 来 越 多 的 学 者 关注 粒 
子 群 优化 算法 的 应 用 ， 将 其 应 用 于 非 线性 规划 ， 同 步 发 电机 辨识 ， 车 辆 
路 径 ， 约 束 布局 优化 ， 新 产品 组 合 投入 ， 广 告 优化 等 问题 。 

粒子 群 优化 算法 的 提出 是 基于 对 简化 的 社会 模型 的 模拟 。 

自然 界 中 许多 生物 体 具有 一 定 的 群体 行为 ， 人 工 生命 的 主要 研究 领 
域 之 一 就 是 探索 自然 界 生物 的 群体 行为 ， 从 而 在 计算 机 上 构建 其 群体 模 
型 。 通 常 群体 行为 可 以 由 几 条 简单 的 规则 进行 建 模 ， 如 鱼 群 、 鸟 群 等 。 
虽然 每 个 个 体 具 有 非常 简单 的 行为 规则 ， 但 是 群体 行为 却 非常 复杂 。 

一 些 科 学 家 对 鸟 群 或 者 鱼 群 的 群体 性 行为 进行 了 研究 ， 包 括 计 算 机 
模拟 仿真 。Reynolds 和 Heppner， 这 两 位 动物 学 家 在 1987 年 和 1990 年 
发 表 的 论文 中 都 关注 了 乌 群 群体 行动 中 蕴涵 的 美学 ， 他 们 发 现 ， 由 数目 
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庞大 的 个 体 组 成 的 鸟 群 飞行 中 可 以 改变 方向 ， 散 开 或 者 队 形 的 重组 等 ， 
那么 一 定 有 某 种 潜在 的 能 力 或 者 规则 保证 了 这 些 同 步 的 行为 。 这 些 科 学 
家 都 认为 上 述 行为 是 基于 不 可 预知 的 鸟 类 社会 行为 中 的 群体 动态 学 。 在 
这 些 早 期 的 模型 中 他 们 把 重点 都 放 在 了 个 体 间距 的 处 理 上 ， 也 就 是 让 鸟 
群 中 的 个 体 之 间 保持 最 优 的 距离 。 

1975 年 ， 生 物 社会 学 家 Wilson E 0 根据 对 鱼 群 的 研究 ， 在 论文 中 
提出 :“ 至 少 在 理论 上 ， 鱼 群 的 个 体 成 员 能 够 受益 于 群体 中 其 他 个 体 在 
寻找 食物 的 过 程 中 的 发 现 和 以 前 的 经 验 ， 这 种 受益 是 明显 的 ， 它 超过 了 
个 体 之 间 的 竞争 所 带 来 的 利益 消耗 ， 不 管 任何 时 候 食物 资源 不 可 预知 的 
分 散 于 四 处 "。 这 说 明 ， 同 种 生物 之 间 信 息 的 社会 共享 能 够 带 来 好 处 ， 
这 是 PSO 的 基础 。 

对 人 类 的 社会 行为 的 模拟 与 前 者 不 同 ， 最 大 区 别 在 于 抽象 性 ! 鸟 类 
和 鱼 类 是 调节 它们 的 物理 运动 ， 来 避免 天 敌 ， 寻 找 食物 ， 优 化 环境 的 参 
数 ， 比 如 温度 等 。 人 类 调节 的 不 仅 是 物理 运动 ， 还 包括 认 知 和 经 验 变 
量 。 我 们 更 多 的 是 调节 自己 的 信仰 和 态度 ， 来 和 社会 中 的 上 流 人 物 或 者 
专家 ， 或 者 说 在 某 件 事情 上 获得 最 优 解 的 人 保持 一 致 。 

这 种 不 同 导致 了 计算 机 仿真 上 的 差别 ， 至 少 有 一 个 明显 的 因素 : M 
撞 。 两 个 个 体 即 使 不 被 绑 在 一 块 ， 也 具有 相同 的 态度 和 信仰， 但 是 两 只 
鸟 是 绝对 不 可 能 不 碰撞 而 在 空间 中 占据 相同 位 置 的 。 这 是 因为 动物 只 能 
在 三 维 的 物理 空间 中 运动 ， 而 人 类 还 在 抽象 的 多 维 心理 空间 运动 ， 这 里 
是 碰撞 自由 的 〈Collosion - Free) 。 

Kennedy 和 Eberhart 对 Hepper 的 模仿 鸟 群 的 模型 进行 了 修正 ， 以 使 
粒子 能 够 飞 向 解 空间 ， 并 在 最 好 解 处 降落 ， 从 而 得 到 了 粒子 群 优化 
算法 。 


7.2 基本 原理 


本 节 首 先 介绍 基本 粒子 群 优化 算法 ， 这 是 算法 的 初始 版 本 ;然后 介 
绍 粒子 群 优化 算法 的 标准 版 本 ， 这 是 目前 大 多 数 研 究 者 所 使 用 的 版 本 ; 
之 后 对 算法 的 构成 要 素 进行 简单 的 分 析 ; 最 后 给 出 一 个 计算 的 例子 。 


7.2.1 基本 粒子 群 优化 算法 


1. 算法 原理 
算法 的 基本 原理 可 以 描述 如 下 。 
一 个 由 m 个 粒子 (Particle) 组 成 的 群体 (Swarm) fr D ERRE 
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间 中 以 一 定 的 速度 飞行 ， 每 个 粒子 在 搜索 时 ， 考 虑 到 了 自己 搜索 到 的 历 
史 最 好 点 和 群体 内 (或 邻 域内 ) 其 他 粒子 的 历史 最 好 点 ， 在 此 基础 上 
进行 位 置 RE, CRER) 的 变化 。 

第 i 个 粒子 的 位 置 表示 为 : xim (24, xa. s Xa) 

第 i 个 粒子 的 速度 表示 为 : v;= (04, 2, …, vo), 1 xim, 
1«d«xD 

第 i 个 粒子 经 历 过 的 历史 最 好 点 表示 为 : p; = (pas Pas “> Po) 

群体 内 (或 邻 域 内 ) 所 有 粒子 所 经 过 的 最 好 的 点 表示 为 : pe = 
(Pas Par > Pac 

一 般 来 说 ， 粒 子 的 位 置 和 速度 都 是 在 连续 的 实数 空间 内 进行 取 值 。 

粒子 的 位 置 和 速度 根据 如 下 方程 进行 变化 : 

vig! =vio tel Pin xl) * cin Pho - xi) (7.1) 

alt! ahto (7.2) 

HF, c, Alc, 称 为 学 习 因 子 (Learning Factor) 或 加 速 系数 (Accelera- 

tion Coefficient) ， 一 般 为 正常 数 。 学 习 因 子 使 粒子 具有 自我 总 结 和 向 群 

体 中 优秀 个 体 学 习 的 能 力 ， 从 而 向 自己 的 历史 最 优点 以 及 群体 内 或 邻 域 

内 的 历史 最 优点 靠近 。c, Ale, 通常 等 于 2。#, ne U[0, 1] ,是 在 [0， 

1] 区 间 内 均匀 分 布 的 伪 随机 数 。 粒 子 的 速度 被 限制 在 一 个 最 大 速度 
Y。 的 范围 内 。 

当 把 群体 内 所 有 粒子 都 作为 邻 域 成 员 时 ， 得 到 粒子 群 优 化 算法 的 全 
局 版 本 ; 当 群 体内 部 分 成 员 组 成 邻 域 时 得 到 粒子 群 优化 算法 的 局 部 版 
本 。 局 部 版 本 中 ， 一 般 有 两 种 方式 组 成 邻 域 ， 一 种 是 索引 号 相 邻 的 粒子 
组 成 邻 域 ， 另 一 种 是 位 置 相 邻 的 粒子 组 成 邻 域 。 粒 子 群 优化 算法 的 邻 域 
定义 策略 又 可 以 称 为 粒子 群 的 邻 域 拓扑 结构 。 

2. 算法 流程 

基本 粒子 群 优化 算法 的 流程 如 下 : 

第 1 步 : 在 初始 化 范围 内 ,对 粒子 群 进行 随机 初始 化 ， 包 括 随机 位 
置 和 速度 。 

第 2 步 : 计算 每 个 粒子 的 适应 值 。 

第 3 步 : 对 于 每 个 粒子 ， 将 其 适应 值 与 所 经 历 过 的 最 好 位 置 的 适应 
值 进行 比较 ， 如 果 更 好 ， 则 将 其 作为 粒子 的 个 体 历史 最 优 值 ， 用 当前 位 
置 更 新 个 体 历史 最 好 位 置 。 

第 4 步 : 对 每 个 粒子 ， 将 其 历史 最 优 适应 值 与 群体 内 或 邻 域内 所 经 
历 的 最 好 位 置 的 适应 值 进行 比较 ， 若 更 好 ， 则 将 其 作为 当前 的 全 局 最 好 
位 置 。 
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第 5 步 : 根据 式 (7.1) 和 (7.2) 对 粒子 的 速度 和 位 置 进行 更 新 。 

BOL: 若 未 达到 终止 条 件 ， 则 转 第 2 步 。 

一 般 将 终止 条 件 设 定 为 一 个 足够 好 的 适应 值 或 达到 一 个 预 设 的 最 大 
迭代 代数 。 

3. 粒子 的 社会 行为 分 析 

从 粒子 的 速度 更 新 方程 (7.1) 可 以 看 到 ， 基 本 粒子 群 优化 算法 
中 ， 粒 子 的 速度 主要 由 三 部 分 构成 。 

(1) 前 次 迭代 中 自身 的 速度 

x (7.1) 右 侧 第 一 项 ， 这 是 粒子 飞行 中 的 惯性 作用 ， 是 粒子 能 够 
进行 飞行 的 基本 保证 。 

(2) 自我 认 知 的 部 分 

R (7.1) 右 侧 第 二 项 ， 表 示 粒 子 飞行 中 考虑 到 自身 的 经 验 ， 向 自 
己 曾 经 找到 过 的 最 好 点 靠近 。 

(3) 社会 经 验 的 部 分 

X (7.1) 右 侧 第 三 项 ， 表 示 粒 子 飞行 中 考虑 到 社会 的 经 验 ， 向 邻 
域 中 其 他 粒子 学 习 ， 使 粒子 在 飞行 时 向 邻 域内 所 有 粒子 曾经 找到 过 的 最 
好 点 靠近 。 

Kennedy 通过 神经 网 络 训练 的 实验 研究 了 粒子 飞行 时 的 行为 ， 在 实 
验 中 将 粒子 的 速度 更 新 公式 分 别 取 以 下 几 种 情况 : 

(1) 完全 模型 (Full model); 即 按照 原始 公式 (7.1) 进行 速度 更 
新 。 

(2) 只 有 自我 认 知 (Cognition - only) ; 即 速度 更 新 时 只 考虑 上 述 
第 1 项 和 第 2 项 。 

(3) 只 有 社会 经 验 (Social - only) : 即 速度 更 新 时 只 考虑 上 述 第 1 
项 和 第 3 项 。 

(4) 无 私 (Selfless) : 即 速度 更 新 时 只 考虑 上 述 第 1 项 和 第 3 项 ， 
并 且 邻 域 不 包括 粒子 本 身 。 

这 里 考虑 “无 私 ” 的 情况 是 因为 ， 在 只 有 社会 经 验 的 模型 中 ， 如 
果 粒 子 自身 取得 的 历史 最 好 解 就 是 邻 域 最 好 解 ， 那 么 粒子 还 是 会 被 自身 
取得 的 历史 最 好 解 所 吸引 ， 这 容易 引起 效果 上 的 混淆 , “无私 ”情形 可 
以 彻底 去 掉 自身 认 知 的 影响 。 

实验 结果 表明 : @ 对 于 所 有 的 情形 ， 最 大 速度 V。。. 过 小 常常 导致 搜 
索 的 失败 ;而 较 大 的 了 .- 常 使 粒子 飞 过 目标 区 域 ， 这 可 能 使 粒子 找到 更 
好 的 区 域 ， 即 ， 使 粒子 脱离 局 优 。@O 上 述 速度 更 新 模型 按照 达到 规定 误 
差 所 需 的 迭代 次 数 从 少 到 多 依次 为 
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只 有 社会 经 验 < 无 私 < 完全 模型 < 只 有 自我 认 知 

这 里 神经 网 络 训练 的 是 XOR 问题 ， 这 说 明 ， 对 于 简单 问题 ， 只 有 
社会 经 验 的 模型 可 以 最 快 达到 收敛 ,这 是 因为 粒子 间 的 社会 信息 的 共 
享 导致 进化 速度 加 快 。 而 只 有 自我 认 知 的 模型 收敛 最 慢 ， 这 是 因为 不 同 
的 粒子 间 缺 乏 信息 交流 ， 没 有 社会 信息 的 共享 ， 导 致 找到 最 优 解 的 概率 
变 小 。 

但 是 ， 需 要 注意 的 是 ， 收 敛 速度 不 是 优化 效果 的 唯一 评价 指标 。 特 
别 是 对 于 复杂 的 问题 ， 只 考虑 社会 经 验 ， 将 导致 粒子 群体 过 早 收敛 ， 从 
而 陷于 局 优 ; 只 考虑 个 体 自身 经 验 ， 将 使 群体 很 难 收敛 ， 进 化 速度 过 
慢 。 相 对 而 言 ， 完 全 模型 是 较 好 的 选择 。 


7.2.2 标准 粒子 群 优化 算法 


为 改善 算法 收敛 性 能 ，Shi #1 Eberhart 在 1998 年 的 论文 中 引入 了 惯 

性 权重 的 概念 ， 将 速度 更 新 方程 修改 为 式 (7.3) 所 示 
ott! mnl, c EC ph - xu) ems - xu) (7.3) 

Hb, o 称 为 惯性 权重 ， 其 大 小 决定 了 对 粒子 当前 速度 继承 的 多 少 ， 合 
适 的 选择 可 以 使 粒子 具有 均衡 的 探索 能 力 ( Exploration， 即 广 域 搜索 能 
H) 和 开发 能 力 (Exploitation， 即 局 部 搜索 能 力 )。 可 见 ， 基 本 粒子 群 
优化 算法 是 惯性 权重 o = 1 的 特殊 情况 。 

分 析 和 实验 表明 ， 设 定 Y。. 的 作用 可 以 通过 惯性 权重 的 调整 来 实 
现 。 现 在 的 粒子 群 优化 算法 基本 上 使 用 V.,, 进 行 初始 化 ， 将 Va BE 
每 维 变量 的 变化 范围 ， 而 不 必 进 行 细致 的 选择 与 调节 。 

目前 ， 对 于 粒子 群 优化 算法 的 研究 大 多 以 带 有 惯性 权重 的 粒子 群 优 
化 算法 为 对 象 进行 分 析 、 扩 展 和 修正 ， 因 此 大 多 数 文献 中 将 带 有 惯性 权 
重 的 粒子 群 优化 算法 称 为 粒子 群 优化 算法 的 标准 版 本 ,或 者 称 为 标准 粒 
子 群 优化 算法 ; 而 将 前 述 粒 子 群 优化 算法 称 为 初始 粒子 群 优化 算法 / 基 
本 粒子 群 优化 算法 ， 或 者 称 为 粒子 群 优化 算法 的 初始 版 本 。 


7.2.3 算法 构成 要 素 


这 里 将 对 粒子 群 优 化 算法 的 构成 要 素 进行 概述 。 这 些 构成 要 素 包 括 
算法 的 相关 参数 : 群体 大 小 、 学 习 因子 、 最 大 速度 、 惯 性 权重 。 也 包括 
算法 设计 中 的 相关 问题 : 邻 域 拓扑 结构 、 粒 子 空间 的 初始 化 和 停止 
准则 。 

1. 群体 大 小 m 

m 是 个 整 型 参数 。 当 m 很 小 的 时 候 ， 陷 人 局 优 的 可 能 性 很 大 。 然 
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而 ,群体 过 大 将 导致 计算 时 间 大 幅 增 加 。 并 且 当 群体 数目 增长 至 一 定 水 
平时 ， 再 增长 将 不 再 有 显著 的 作用 。 当 m =1 的 时 候 ，PSO 算法 变 为 基 
于 个 体 搜索 的 技术 ,一 旦 陷入 局 优 ， 将 不 可 能 跳出 。 当 m 很 大 时 ，PSO 
的 优化 能 力 很 好 ， 可 是 收敛 的 速度 将 非常 慢 。 

2. 学 习 因 子 c, Mc, 

学 习 因 子 使 粒子 具有 自我 总 结 和 向 群体 中 优秀 个 体 学 习 的 能 力 ， 从 
而 向 群体 内 或 邻 域内 最 优点 靠近 。c, 和 e 通常 等 于 2， 不 过 在 文献 中 也 
有 其 他 的 取 值 。 但 是 一 般 c, 等 于 c,， 并 且 范 围 在 0 和 4 之 间 。 

3. 最 大 速度 : V... 

最 大 速度 决定 粒子 在 一 次 迭代 中 最 大 的 移动 距离 。V。 较 大 ， 探索 
能 力 增强 ,但 是 粒子 容易 飞 过 最 好 解 。V。, 较 小 时 ， 开 发 能 力 增强 ,但 
是 容易 陷入 局 优 。 有 分 析 和 实验 表明 ， 设 定 Yu 的 作用 可 以 通过 惯性 权 
重 的 调整 来 实现 。 所 以 现在 的 实验 基本 上 使 用 .进行 初始 化 ， 将 Vw 
设 定 为 每 维 变量 的 变化 范围 ， 而 不 必 进 行 细致 的 选择 与 调节 。 

4. 惯性 权重 

智能 优化 方法 的 运行 是 否 成 功 ， 探 索 能 力 和 开发 能 力 的 平衡 是 非常 
关键 的 。 对 于 粒子 群 优化 算法 来 说 ， 这 两 种 能 力 的 平衡 就 是 靠 惯性 权重 
来 实现 。 较 大 的 惯性 权重 使 粒子 在 自己 原来 的 方向 上 具有 更 大 的 速度 ， 
从 而 在 原 方向 上 飞行 更 远 ， 具 有 更 好 的 探索 能 力 ; 较 小 的 惯性 权重 使 粒 
子 继承 了 较 少 的 原 方向 的 速度 ， 从 而 飞行 较 近 ， 具 有 更 好 的 开发 能 力 。 
通过 调节 惯性 权重 能 够 调节 粒子 群 的 搜索 能 力 。 

5. 领域 拓扑 结构 

全 局 版 本 粒子 群 优化 算法 将 整个 群体 作为 粒子 的 邻 域 ， 速 度 快 ， 不 
过 有 时 会 陷入 局 部 最 优 ; 局 部 版 本 粒子 群 优化 算法 将 索引 号 相近 或 者 位 
置 相近 的 个 体 作为 粒子 的 邻 域 ， 收 敛 速度 慢 一 点 ， 不 过 很 难 陷 人 局 部 最 
优 。 显 然 ， 全 局 版 本 的 粒子 群 优化 算法 可 以 看 作 局 部 版 本 粒子 群 优 化 算 
法 的 一 个 特例 ， 即 将 整个 群体 都 作为 邻 域 。 

6. 停止 准则 

一 般 使 用 最 大 迭代 次 数 或 可 以 接受 的 满意 解 作 为 停止 准则 。 

7. 粒子 空间 的 初始 化 

较 好 地 选择 粒子 的 初始 化 空间 ， 将 大 大 缩短 收敛 时 间 。 这 是 问题 依 
mH. 

从 上 面 的 介绍 可 以 看 到 ， 实 际 上 粒子 群 优化 算法 并 没有 过 多 需要 调 
节 的 参数 。 相 对 来 说 ， 惯 性 权重 和 邻 域 定义 较 为 重要 。 
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7.2.4 计算 举例 


下 面 以 一 个 简单 的 例子 来 说 明 粒子 群 优化 算法 是 如 何 工作 的 。 
1. 最 优化 问题 
求解 以 下 的 无 约束 优化 问题 (Rosenbrock 函数 ) : 

minf(x) = Y [100(x,4 = 2)? + (x, - 7] 


“rel -30, 30] (7.4) 
其 中 ， 问 题 的 维 数 n =5。 
当 变 量 取 二 维 时 目标 函数 的 图 形 如 图 7. 1 所 示 。 


图 7.1  Rosenbrock 曲面 图 


2. 简单 分 析 

Rosenbrock 是 一 个 著名 的 测试 函数 ， 也 叫 香蕉 函数 ， 其 特点 是 该 函 
数 虽然 是 单 峰 函数 ， 在 [100，100]" 上 只 有 一 个 全 局 极 小 点 ， 但 它 在 
全 局 极 小 点 临近 的 狭长 区 域内 取 值 变化 极为 缓慢 ， 常 用 于 评价 算法 的 搜 
索性 能 。 这 种 优化 问题 非常 适合 于 使 用 粒子 群 优化 算法 来 求解 。 这 里 使 
用 标准 版 本 的 算法 来 求解 ， 算 法 的 相关 设计 分 析 如 下 。 

编码 : 因为 问题 的 维 数 为 5， 所 以 每 个 粒子 为 5 维 的 实数 向 量 。 

初始 化 范围 : 根据 问题 要 求 ， 设 定 为 [ -30，30]。 根 据 前 面 的 参 
数 分 析 ， 可 以 将 最 大 速度 设 定 为 V.,, 260 

种 群 大 小 : 为 了 说 明 方 便 ， 这 里 采用 一 个 较 小 的 种 群 规模 ，m =5。 

停止 准则 : 设 定 为 最 大 迭代 次 数 100 次 。 
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惯性 权重 : 采用 固定 权重 0. 5。 

邻 域 拓 扑 结构 : 使 用 星 形 拓扑 结构 ， 即 全 局 版 本 的 粒子 群 优化 
算法 。 

3. oR 

第 1 步 : 设置 相关 参数 ， 在 初始 化 范围 内 ， 对 粒子 群 进行 随机 初始 
化 ,包括 随机 位 置 和 速度 。 

第 2 步 : 计算 每 个 粒子 的 适应 值 。 

第 3 步 : 更 新 粒子 的 个 体 历史 最 好 值 和 最 好 解 以 及 整个 群体 的 历史 
最 好 值 和 最 好 解 。 

第 4 步 : 根据 式 (7.3) 和 式 (7.2) 对 粒子 的 速度 和 位 置 进行 更 新 。 

第 5 步 : 若 迭 代 次 数 未 达到 100， 则 转 第 2 步 。 

4 一 次 和 迭代 结果 

各 个 粒子 的 初始 位 置 如 下 : 

x? = ( -15.061812, -23.799465,25. 508911 ,4. 867607 , -4. 6115036) 

x? = (29.855438, -25.405956, 6.2448387, 10.079613, -26. 621386) 

x? = (23.805588, 19.57822, -8.61554, 9.441231, —29.898735) 

x? = (7. 1804657 , — 13. 258207, - 29. 63405 , — 27. 048172 ,2. 2427979) 

x! = ( —4. 7385902, 17. 732449 , — 24. 78365 , — 3. 8092823 ,4. 3552084) 

各 个 粒子 的 初始 速度 如 下 : 

v? = ( -5.2273927 ,15. 964569, - 11. 821243 ,42. 65571, - 48. 36218) 

v? = ( -0.42986897, -0. 5701652, — 18. 416643, —51. 86605, - 33. 90133) 

v? = (13. 069403, - 48, 511078 ,28. 80003, —8. 051167, —28.049505) 

v? = ( -8. 85361 ,12. 998845, — 13. 325946,18. 722532, - 26. 033237) 

v? = ( —5. 7461033, — 7. 451118,29. 135513, — 14. 144024, —41. 325256) 

各 个 粒子 的 初始 适应 值 如 下 : 

f° 27. 733296E7 

f$ 21. 26632864E8 

f$ 74. 7132888E7 

f° = 1. 39781552E8 

f 24. 98773E7 

BR, PFI 取得 了 群体 中 最 好 的 位 置 和 适应 值 ， 将 其 作为 群体 历 
ERRE. 

经 过 一 次 迭代 后 ， 粒 子 的 位 置 变 化 为 

xi- (2.4265985, 29.665405, 18.387815, 29.660393, -39.97371) 


72 基本 原理 225 


x} = (22. 56745 , —3.999012, — 19. 23571 , - 16. 373426, —45. 417023) 

xj = (30.34029, -4.6773186, 5.7844753, 5.4156475, —43.92349) 

x, = (2.794329%, 19.942759, —24.861498, 16.060974, —57.757202) 

x = (27.509708, 28.379063, 13.016331, 11.539068, —53.676777) 

从 上 面 的 数据 可 以 看 到 ， 粒 子 有 的 分 量 跑 出 了 初始 化 范围 。 需 要 说 
明 的 是 ， 在 这 种 情况 下 ， 一 般 不 强行 将 粒子 重新 拉 回 到 初始 化 空间 ， 即 
使 初始 化 空间 也 是 粒子 的 约束 空间 。 因 为 ， 即 使 粒子 跑 出 初始 化 空间 ， 
随 着 迭代 的 进行 ， 如 果 在 初始 化 空间 内 有 更 好 的 解 存在 ， 那 么 粒子 也 可 
以 自行 返回 到 初始 化 空间 。 

而 且 有 研究 表明 ， 即 使 将 初始 化 空间 不 设 定 为 问题 的 约束 空间 ， 即 
问题 的 最 优 解 不 在 初始 化 空间 内 ， 粒 子 也 可 能 找到 最 优 解 。 

第 一 次 迭代 后 ， 各 个 粒子 的 适应 值 为 

f} 2 1. 68403632E8 

f} =5. 122986E7 

fi =8. 6243528E7 

fi =6. 4084752E7 

f} = 1. 21824928E8 

此 时 ， 取 得 最 好 解 的 是 粒子 2。 

5. 100 次 迭代 结果 

100 次 迭代 后 ， 粒 子 的 位 置 及 适应 值 如 下 : 

x! = (0.8324391, 0.71345127, 0.4540729, ，0. 19283025, - 0. 01689619) 

xi? = (0.7039059, 0.75927746, 0.42355448, 0.20572342, 1.0952349) 

xi" = (0.8442569, 0.670473, 0.45867932, 0. 19491772, 0.016728058) 

x!" = (0.8238968, 0.67699957, 0.45485318, 0. 1967013, 0.015787406) 

xi? = (0.8273693, 0.675995, 0.45461038, 0. 19740629, 0.01580313) 

fi? 21. 7138834 

fi” =121. 33863 

im = 1. 2665054 

fi? = 1. 1421927 

f$" =1. 1444693 

从 结果 可 以 看 到 ， 粒 子 2 的 适应 值 较 大 ， 这 是 因为 100 KERER 
子 群 还 没有 充分 收敛。 而 这 也 在 一 定 程度 上 保持 了 种 群 的 多 样 性 。 图 
7.2 是 群体 历史 最 优 适应 值 随和 迭代 次 数 增加 的 变化 曲线 。 因 为 适应 值 变 
化 过 大 ， 所 以 对 其 取 对 数 。 
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图 7.2 适应 值 曲 线 


7.3 PSO 的 改进 与 变形 


这 一 节 里 ， 首 先 介绍 算法 的 三 个 构成 要 素 的 选择 和 调节 : MER 
重 、 邻 域 拓 扑 结构 和 学 习 因 子 ; 然后 介绍 粒子 群 优化 算法 另外 一 个 重要 
的 改进 版 本 : 带 有 收缩 因子 的 粒子 群 优化 算法 ; 再 针对 离散 优化 问题 ， 
说 明 两 个 典型 的 离散 版 本 粒子 群 优化 算法 ; 之 后 ， 介 绍 几 种 基于 遗传 思 
想 和 梯度 信息 的 改进 策略 ; 最 后 是 算法 在 两 类 复杂 环境 中 的 解决 方案 : 
约束 优化 和 多 目标 优化 。 


7.3.1 惯性 权重 


惯性 权重 是 粒子 群 优 化 算法 标准 版 本 的 重要 参数 ， 算 法 的 成 败 很 大 
程度 上 取决 于 该 参数 的 选取 和 调节 。 下 面 介 绍 设置 惯性 权重 的 几 种 基本 
方法 。 

1. MERNE 

即 赋予 惯 性 权重 以 一 个 常数 值 ， 一 般 来 说 ， 该 值 在 0 和 1 之 间 。 固 
定 的 惯性 权重 使 粒子 在 飞行 中 始终 具有 相同 的 探索 和 开发 能 力 。 显 然 
对 于 不 同 的 问题 ， 获 得 最 好 优化 效果 的 这 个 常数 是 不 同 的 ， 要 找到 这 个 
值 需要 大 量 的 实验 。 通 过 实验 发 现 : 种 群 规模 越 小 ， 需 要 的 惯性 权重 越 
大 ， 因 为 此 时 种 群 需 要 更 好 的 探索 能 力 来 弥补 粒子 数量 的 不 足 ， 否 则 粒 
子 极 易 收敛 ; 种 群 规模 越 大 ， 需 要 的 惯性 权重 越 小 ， 因 为 每 个 粒子 可 以 
更 专注 于 搜索 自己 附近 的 区 域 。 
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2. 时 变 权 重 

一 般 来 说 ， 希 望 粒子 群 在 飞行 开始 的 时 候 具有 较 好 的 探索 能 力 ， 而 
随 着 迭代 次 数 的 增加 ， 特 别 是 在 飞行 的 后 期 ， 希 望 具有 较 好 的 开发 能 
力 。 所 以 希望 动态 调节 惯性 权重 。 可 以 通过 时 变 权重 的 设置 来 实现 。 设 
惯性 权重 的 取 值 范围 为 : [w。。，w。*] ， 最 大 和 迭代 次 数 为 fer_ max, WU 
第 i 次 迭代 时 的 惯性 权重 可 以 取 为 


0, = 0... — ee KI (7.5) 


这 是 一 种 线性 减 小 的 变化 方式 。 也 可 以 采用 非 线性 减 小 的 方式 来 设 
置 惯性 权重 。 根 据 实际 的 问题 来 确定 最 大 权重 w。.: 和 最 小 权重 wano R 
性 时 变 权重 是 在 实际 应 用 中 使 用 最 为 广泛 的 一 种 方式 。 

3. 模糊 权重 

模糊 权重 是 使 用 模糊 系统 来 动态 调节 惯性 权重 。 例 如 ,文献 [28] 
使 用 如 下 具有 9 条 规则 、2 个 输入 和 1 个 输出 的 模糊 系统 。 

输入 变量 : 两 个 。 当 前 最 好 的 适应 值 (CBPE) 和 当前 惯性 权重 。 

输出 变量 : 一 个 。 即 惯性 权重 的 变化 〈 百 分 比 表示 ) 。 

这 里 ，CBPE 测量 的 是 PSO 找到 的 最 好 候选 解 的 性 能 。 由 于 不 同 的 
优化 问题 有 不 同 的 性 能 评价 值 范围 ， 所 以 为 了 让 该 模糊 系统 有 广泛 的 适 
用 性 ， 可 以 使 用 标准 化 的 CBPE (NCBPE) 。 假 定 优化 问题 为 最 小 化 问 
题 ， 则 

CBPE - CBPE。。 
CBPE,,, - CBPE,,, 
其 中 ，CBPE。。 为 估计 的 〈 或 实际 的 ) 最 小 值 ， 而 CBPE。,. 为 非 优 
CBPE， 任 何 CBPE 值 大 于 或 等 于 CBPE,。.. 的 解 都 是 最 小 化 问题 所 不 能 接 
受 的 解 。 

每 个 输入 和 输出 定义 了 三 条 模糊 集合 : 低 、 中 、 高 ， 相 对 应 的 隶属 
度 函 数 分 别 为 : 左 三 角形 、 三 角形 和 右 三 角形 。 共 九条 规则 。 这 三 个 隶 
属 度 函 数 分 别 定义 如 下 。 

左 三 角 素 属 度 函 数 


NCBPE = (7.6) 


fn vinnie = Sx (7.7) 


三 角 素 属 度 函 数 
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0 caer 
x-z aerei tn 
Ma 一 和 1 
Ja = (7.8) 
ba 一 各 Ky +X, 
PE 2 4*9 
0 xXx, 
右 三 角 隶 属 度 函 数 
0 xxu 
x-X 
prm Lo x xxx, (7.9) 


zx 
1 xx 

KH, x, Mx, 是 决定 隶属 度 函 数 形状 的 关键 参数 。 

4. 随机 权重 

随机 权重 是 在 一 定 范围 内 随机 取 值 。 例 如 可 以 取 值 如 下 


Random 
2 


Mb, Random 为 0 - 1 之 间 的 随机 数 。 这 样 ， 惯 性 权重 将 在 0.5 ~ 1 之 
间 随 机 变化 ， 均 值 为 0.75。 之 所 以 这 样 设 定 ， 是 为 了 应 用 于 动态 优化 
问题 。 将 惯性 权重 设 定 为 线性 减 小 的 时 变 权重 是 为 了 在 静态 的 优化 问题 
中 使 粒子 群 在 选 代 开 始 的 时 候 具 有 较 好 的 全 局 寻 优 能 力 ， 即 探索 能 力 ， 
而 在 迭代 后 期 具有 较 好 的 局 部 寻 优 能 力 ， 即 开发 能 力 。 而 对 于 动态 优化 
问题 来 说 ， 不 能 够 预测 在 给 定 的 时 间 粒 子 群 需要 更 好 的 探索 能 力 还 是 更 
好 的 开发 能 力 。 所 以 ， 可 以 使 惯性 权重 在 一 定 范围 内 随机 变化 。 


7.3.2. 邻 域 拓扑 结构 


如 何 定义 粒子 的 邻 域 组 成 ， 即 邻 域 的 拓扑 结构 ， 是 算法 实现 中 的 一 
个 基本 问题 。 在 7. 2. 1 中 介绍 了 ， 一 般 有 两 种 方式 组 成 邻 域 ， 一 种 是 索 
引号 相 邻 的 粒子 组 成 邻 域 ， 另 一 种 是 位 置 相 邻 的 粒子 组 成 邻 域 。 下 面 来 
详细 说 明 这 两 类 邻 域 拓扑 结构 。 

1. 基于 索引 号 的 拓扑 结构 

这 类 拓扑 结构 最 大 的 优点 是 在 确定 邻 域 时 不 考虑 粒子 间 的 相对 位 
置 ， 从 而 避免 确定 邻 域 时 的 计算 消耗 。 

(1) 环形 结构 

环形 结构 是 一 种 基本 的 邻 域 拓扑 结构 ， 每 个 粒子 只 与 其 直接 的 K 
个 邻居 相连 ， 即 ， 与 该 粒子 索引 号 相近 的 天 个 粒子 构成 该 粒子 的 邻 域 


w=0.5+ 


(7.10) 
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成 员 。 例 如 ， 当 天 =2 时 ， 对 于 粒子 i,， 定 义 其 邻 域 成 员 为 : 粒子 i -1 
和 粒子 ;+1 (也 可 以 将 上 述 情况 称 为 邻 域 半径 为 1)。 在 迭代 过 程 中 
这 种 邻 域 组 成 保持 不 变 。 图 7. 3 是 环形 拓扑 结构 的 示意 图 。 

环形 结构 下 ， 种 群 的 一 部 分 可 以 聚集 于 一 个 局 优 ， 而 另外 一 部 分 可 
能 聚集 于 不 同 的 局 优 ， 或 者 再 继续 搜索 ， 避 免 过 早 陷 人 局 优 。 邻 居间 的 
影响 一 个 一 个 地 传递 ， 直 到 最 优点 被 种 群 的 任何 一 个 部 分 找到 ， 然 后 使 
整个 种 群 收敛 。 


图 7.3 环形 拓扑 结构 
可 以 在 环形 拓扑 结构 中 加 入 两 条 捷径 (Shortcut) ， 得 到 带 有 捷径 的 
环形 拓扑 结构 ， 如 图 7.4 所 示 。 有 两 个 粒子 的 邻 域 发 生变 化 ， 即 随机 地 
选取 种 群 中 的 另 一 个 粒子 作为 自己 的 邻 域 成 员 ， 从 而 加 强 了 不 同 粒子 邻 
域 之 间 的 信息 交流 。 这 样 变化 后 的 环形 拓扑 结构 缩短 了 邻 域 间 的 距离 
种 群 将 更 快 收敛 。 


图 7.4 带 有 捷径 的 环形 拓扑 结构 
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(2) 轮 形 结构 

轮 形 结构 是 令 一 个 粒子 作为 焦点 ， 其 他 粒子 都 与 该 焦点 粒子 相连 ， 
而 其 他 粒子 之 间 并 不 相连 ， 如 图 7.5 所 示 。 这 样 所 有 的 粒子 都 只 能 与 焦 
点 粒子 进行 信息 交流 ， 有 效 地 实现 了 粒子 之 间 的 分 离 。 焦 点 粒子 比较 其 
PR (MEHR) 中 所 有 粒子 的 表现 ， 然 后 调节 其 本 身 飞 行 轨迹 向 
最 好 点 靠近 。 这 种 改进 再 通过 焦点 粒子 扩散 到 其 他 粒子 。 所 以 焦点 粒子 
的 功能 类 似 一 个 缓冲 器 ， 减 慢 了 较 好 的 解 在 种 群 中 的 扩散 速度 。 


图 7.5 轮 形 拓扑 结构 
同样 也 可 以 在 轮 形 拓扑 结构 中 加 入 两 条 捷径 ， 得 到 带 有 捷径 的 环形 
拓扑 结构 ， 如 图 7. 6 所 示 。 带 有 捷径 的 轮 形 拓扑 结构 可 以 产生 两 方面 的 
效果 。 一 方面 ， 能 够 产生 迷你 邻 域 (Mini - Neighborhood) ， 迷 你 邻 域 中 
的 外 围 粒 子 被 直接 与 焦点 粒子 相连 的 粒子 所 影响 ， 这 样 在 迷你 邻 域 这 个 
合作 的 子 种 群 内 可 以 更 快 地 收敛 ， 焦 点 粒子 的 缓冲 器 又 可 以 防止 整个 种 


图 7.6 带 有 捷径 的 轮 形 拓扑 结构 
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群 过 早 收敛 于 局 优 。 另 一 方面 ， 也 可 能 产生 孤岛 ， 或 分 离子 种 群 间 的 联 
系 ， 使 子 种 群 内 部 进行 合作 ， 独 立地 进行 问题 的 优化 。 这 将 导致 信息 交 
流 的 减少 ， 使 那些 分 离 的 个 体 不 能 得 到 整个 种 群 所 找 的 好 的 区 域 ; 也 使 
种 群 其 他 粒子 不 能 分 享 被 分 离 的 个 体 搜 索 中 获得 的 成 功 信息 。 

(3) 星 形 结构 

星 形 拓扑 结构 是 每 个 粒子 都 与 种 群 中 的 其 他 所 有 粒子 相连 ， 即 将 整 
个 种 群 作为 自己 的 邻 域 。 也 就 是 粒子 群 算法 的 全 局 版 本 。 这 种 结构 下 ， 
所 有 粒子 共享 的 信息 是 种 群 中 表现 最 好 的 粒子 的 信息 。 

(4) 随机 结构 

随机 结构 是 在 N 个 粒子 的 种 群 中 间 ， 随 机 地 建立 N 个 对 称 的 两 两 
连接 。 

2. 基于 距离 的 拓扑 结构 

基于 距离 的 拓扑 结构 是 在 每 次 迭代 时 ， 计 算 一 个 粒子 与 种 群 中 其 他 
粒子 之 间 的 距离 ， 然 后 根据 这 些 距离 来 确定 该 粒子 的 邻 域 构成 。 下 面 是 
一 个 具体 的 实现 方法 : 动态 邻 域 拓扑 结构 。 

在 搜索 开始 的 时 候 ， 粒 子 的 邻 域 只 有 其 自己 ， 即 将 个 体 最 优 解 作为 
邻 域 最 优 解 ， 然 后 随 着 迭代 次 数 的 增加 ， 逐 渐 增 大 邻 域 ， 直 至 最 后 将 群 
体 中 所 有 粒子 作为 自己 的 邻 域 成 员 。 这 样 使 初始 迭代 时 可 以 有 较 好 的 探 
索性 能 ， 而 在 迭代 后 期 可 以 有 较 好 的 开发 性 能 。 

对 将 要 计算 邻 域 的 粒子 i， 计 算 其 与 种 群 中 其 他 所 有 粒子 的 距离 。 该 
粒子 与 粒子 1(1 关 i) 的 距离 记 为 dist [1]. 。 最 大 的 距离 记 为 max dist. 

定义 一 个 关于 当前 迭代 次 数 的 函数 ,Foe ( 取 值 为 纯 小 数 ) 


dcn 3.0 x ITER «0. 6 x MAXITER 
F MAXITER 


M frac «0.9 时 ,满足 下 列 条 件 的 粒子 构成 当前 粒子 i 的 邻 域 ， 即 
dist (1] 
max_ dist 


M fracz 0.9 时 ， 将 种 群 中 所 有 粒子 作为 当前 粒子 i 的 邻 域 。 
7.3.3 学 习 因子 


学 习 因子 一 般 固定 为 常数 ， 并 且 取 值 为 2。 但 是 也 有 研究 者 尝试 了 
一 些 其 他 的 取 值 和 其 他 的 设置 方式 。 

1. e, Me, 同步 时 变 

Suganthan 在 实验 中 ,参照 时 变 惯性 权重 的 设置 方法 ， 将 学 习 因子 
设置 如 下 : 设 学 习 因子 eH c 的 取 值 范围 为 [cw。，csr] ， 最 大 选 代 次 


(7.11) 


« frac, 
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数 为 ler_ max， 则 第 i 次 迭代 时 的 学 习 因 子 取 为 


Cmax 一 Cain 


二 三 xi (7.12) 


esi 
== [fter max 


这 是 一 种 两 个 学 习 因子 同步 线性 减 小 的 变化 方式 ， 所 以 这 里 称 之 为 
同步 时 变 。 特 别 地 ，Suganthan 在 实验 中 将 参数 设置 为 : cs。 = 3， 
Coin =0.25。 但 是 发 现 ， 这 种 设置 下 ， 解 的 质量 反而 下 降 。 

2. c, Me, 异步 时 变 

Ratnaweera 等 提出 了 另 一 种 时 变 的 学 习 因 子 设置 方式 ， 使 两 个 学 习 
因子 在 优化 过 程 中 随时 间 进 行 不 同 的 变化 ， 所 以 这 里 称 之 为 异步 时 变 。 
这 种 设置 的 目的 是 在 优化 初期 加 强 全 局 搜索 ， 而 在 搜索 后 期 促使 粒子 收 
剑 于 全 局 最 优 解 。 这 种 想法 可 以 通过 随 着 时 间 不 断 减 小 自我 学 习 因 子 
ci， 和 不 断 增 大 社会 学 习 因 子 c, 来 实现 。 

(1) 在 优化 的 初始 阶段 ， 粒 子 具 有 较 大 的 自我 学 习 能 力 和 较 小 的 
社会 学 习 能 力 ， 这 样 粒子 可 以 倾向 于 在 整个 搜索 空间 飞行 ， 而 不 是 很 快 
就 飞 向 群体 最 优 解 。 

(2) 在 优化 的 后 期 ， 粒 子 具 有 较 大 的 社会 学 习 能 力 和 较 小 的 自我 
学 习 能 力 ， 使 粒子 倾向 于 飞 向 全 局 最 优 解 。 

具体 实现 方式 如 下 : 


XL —— *6u (7.13) 


+e, (7.14) 


BEAL, Cus Cys Cus CyB, SPS cy 和 cy 的 初始 值 和 最 终 值 。 
Tter_ max 为 最 大 迭代 次 数 ，iter 为 当前 迭代 数 。Ratnaweera 等 在 研究 中 
发 现 ， 对 于 大 多 数 标准 如 下 设置 优化 效果 较 好 : 

cu =2.5, cy=0.5, cu =0.5，cy=2.5 

需要 说 明 的 是 ， 异 步 时 变 的 学 习 因子 应 与 线性 减 小 的 时 变 权 重 配合 

使 用 ， 效 果 较 好 。 


7.3.4， 带 有 收缩 因子 的 粒子 群 优化 算法 


基本 粒子 群 优化 算法 有 两 种 重要 的 改进 版 本 : 加 入 惯性 权重 和 加 入 
收缩 因子 (Constriction Factor) 。 惯 性 权重 的 版 本 已 成 为 标准 版 本 ， 所 
以 放 在 算法 的 基本 原理 中 介绍 ， 收 缩 因子 版 本 放 在 本 节 介绍 。 

Clerc 在 原始 粒子 群 优化 算法 中 引入 可 收缩 因子 的 概念 ， 并 指出 该 
因子 对 于 算法 的 收敛 是 必要 的 。 在 带 有 收缩 因子 的 粒子 群 优化 算法 中 ， 
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速度 的 更 新 方程 如 式 (7.15) 所 示 。 
vus = Ko te (pau) tem (Pra-xu)] (7.15) 
这 里 , 天 是 flc, EE 具体 表达 为 式 (7. 16) 。 
i 32 Wil p=c+c, >4 (7.16) 
Clerc 将 参数 取 值 为 c， Mie 05, o =4. 1。 于 是 可 得 K -0.729, 
显然 ， 如 果 将 标准 版 本 的 粒子 群 优化 算法 取 参 数 
w =0. 729 
c, +c, =0. 729 x2. 05 = 1. 494 45 
则 标准 版 本 的 粒子 群 优化 算法 与 带 有 收缩 因子 的 粒子 群 优化 算法 等 
价 。 即 带 有 收缩 因子 的 版 本 可 以 看 作为 标准 版 本 算法 的 一 个 特例 。 
Eberhart 和 Shi 通过 实验 建议 : 
(1) 如 果 使 用 带 有 收缩 因子 的 粒子 群 优化 算法 ， 将 最 大 速度 。. 限 
AS Xue 
(2) 如 果 使 用 带 有 惯性 权重 的 粒子 群 优化 算法 ， 根 据 式 (7.16) 
来 选择 w, c, c 的 值 。 


7.3.5 离散 版 本 的 粒子 群 优化 算法 


应 该 说 ， 粒 子 群 优化 算法 非常 适合 于 求解 连续 优化 问题 ， 而 求解 离 
散 优 化 问题 并 不 是 该 算法 的 优势 所 在 ， 因 为 离散 变量 在 经 过 粒子 群 优化 
算法 的 速度 和 位 置 更 新 方程 的 计算 后 ， 很 可 能 不 再 保持 为 离散 变量 ， 如 
何 解决 这 一 问题 是 离散 版 本 算法 的 难点 所 在 。 目 前 有 一 些 研究 者 在 努力 
寻求 该 算法 在 离散 优化 中 的 解决 方案 。 下 面 介绍 其 中 典型 的 两 个 解决 方 
R: 二 进 制 编码 和 顺序 编码 。 

1. 二进制 编码 

离散 版 本 的 粒子 群 优化 算法 最 早 是 由 Kennedy 提出 ， 采 用 二 进 制 编 
码 。 即 粒子 的 位 置 向 量 的 每 一 位 取 值 为 0 或 者 1。 下 面 首先 将 二 进 制 编 
码 算法 的 粒子 更 新 公式 列 于 式 (7.17) -R (7.19), 然后 再 详细 说 
明 。 

= 一) (Po 7 xa) (7.17) 
1, random «S (v!) 

lc xn 
SG eL (7.19) 
式 (7.18) 中 的 random 是 一 个 [0, 1] 区 间 内 的 均匀 分 布 的 伪 随 


kt 
a 


(7.18) 
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机 数 。 

显然 , 式 (7.17) 看 上 去 与 基本 粒子 群 优化 算法 的 速度 更 新 公式 
(7.1) 完全 相同 。( 由 于 二 进 制 编码 算法 提出 于 1997 年 ， 当 时 还 没有 
带 有 惯性 权重 的 粒子 群 算法 ， 故 没有 采用 式 (7.3) ) 。 但 是 速度 更 新 公 
式 中 ， 速 度 的 意义 和 位 置 的 取 值 发 生 了 变化 。 

关于 位 置 的 三 个 变量 ru, pu. Pu VA RAR RT E k VORAUS 
的 位 置 、 个 体 历 史 最 优 位 置 和 邻 域 最 优 位 置 。 但 是 这 些 变量 的 取 值 已 经 
全 部 为 0 或 者 1。 

vu "在 这 里 不 再 表示 k+1 次 迭代 时 粒子 飞行 的 速度 。 其 意义 在 于 ， 
根据 vi ' 的 值 来 计算 确定 xx" 取 值 为 1 或 者 为 0 的 概率 。 这 个 概率 由 函 
MOSQ) 来 表达 。 即 不 论 上 次 迭代 时 粒子 的 位 值 为 0 还 是 1， 在 大 +1 
次 迭代 时 x "的 取 值 都 以 概率 SQ). W1, MERI -SQZ') 取 0， 
REER (7.18) 表达 的 意义 。 

S (ok) 是 风 " 的 函数 。 二 进 制版 本 的 初始 想法 是 将 原来 公式 中 
的 速度 风 ' 作 为 粒子 取 值 为 1 的 概率 ， 但 是 因为 "在 计算 中 很 可 能 不 
能 保证 将 其 值 限制 在 【0，1] 区 间 ， 所 以 要 将 vu ' 进 行 变换 ， 将 其 映射 
到 [0, 1] KE, RASO ) 正 是 用 来 完成 此 映射 功能 。5(v') 是 
一 个 S 型 函数 ， 将 vi ' 进 行 简单 的 运算 后 可 以 满足 概率 取 值 的 需求 。 

在 基本 粒子 群 优化 算法 中 ， 粒 子 的 速度 被 限制 在 一 个 范围 内 ， 即 最 
大 速度 Wu。 在 二 进 制版 本 中 ， 仍 然 需要 这 种 限制 ， 即 |w | < Vao 
因为 通过 计算 可 以 知道 ， 当 加" > 10 f, SC) 的 值 将 很 小 ， 导 致 
x 人 "几乎 一 定 取 值 为 0， 这 失去 了 以 概率 取 值 的 意义 。 所 以 ， 要 用 Vu 
来 进行 一 下 限制 。Kennedy 认为 将 V,,, 取 值 为 6 BEA, IERS Cn) BUR 
范围 在 0.9975 ~ 0. 0025 之 间 。 值 得 注意 的 是 ， 在 应 用 于 连续 空间 的 基 
本 粒子 群 优化 算法 中 ，V。.. 越 大 则 粒子 位 置 的 改变 ， 可 能 越 大 ， 粒 子 将 
具有 更 好 的 探索 能 力 ; 而 在 应 用 于 离散 空间 的 二 进 制版 本 算法 中 ， 则 正 
好 相反 ，V。 越 大 ， 可 能 导致 变化 的 概率 越 小 ， 因 为 取 值 为 负 的 viu, 
可 能 绝对 值 很 大 ， 但 是 经 过 式 (7.19) 计算 后 得 到 的 概率 很 小 。 

2. 顺序 编码 

Hu X 等 提出 了 一 种 改进 的 粒子 群 优化 算法 来 解决 排列 问题 ， 因 为 
其 编码 规则 与 遗传 算法 的 顺序 编码 相同 ， 这 里 将 其 称 为 顺序 编码 的 粒子 
群 优化 算法 。 下 面 是 一 个 编码 的 例子 。 

X=(1 2 3 4 5 6 7) 

这 里 编码 长 度 为 ?7， 也 是 粒子 的 位 值 的 变化 范围 。 
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在 这 种 改进 的 离散 版 本 的 算法 中 ,将 速度 也 定义 为 粒子 变化 的 概 
率 ， 而 速度 的 更 新 公式 也 保持 不 变 。 如 果 速 度 较 大 ， 则 粒子 更 可 能 变化 
为 一 个 新 的 排列 序列 。 这 里 速度 显然 也 要 被 加 以 限定 ， 映 射 到 [0，1] 
区 间 。 粒 子 的 更 新 过 程 说 明 如 下 ， 首 先是 粒子 速度 的 规范 化 。 设 粒子 位 
值 变化 范围 为 n， 粒 子 的 速度 为 ?+”"， 则 将 其 规范 化 为 


IL? 
n 


SER, Swap(vz) 的 取 值 范围 在 0，!1 之 间 ， 它 决定 了 粒子 i 的 编 
码 是 否 产 生 一 个 交换 。 如 果 以 该 概率 产生 一 个 交换 ， 则 交换 后 粒子 i 第 
d 位 变化 为 邻 域 最 好 解 相应 的 位 值 。 这 个 过 程 可 以 表示 为 如 图 7.7 


v [Tsls [ofefsT:] 


Swap(v4) = 


(7.20) 


图 7.7 粒子 更 新 示意 图 

图 7.7 中 粒子 位 值 变 化 范围 为 50。 速 度 分 量 为 40 的 位 置 ， 粒子 位 
值 为 ?7， 随 机 产生 一 个 [0，1] 区 间 内 均匀 分 布 的 伪 随 机 数 ， 小 于 
0.8， 所 以 该 位 置 将 产生 一 个 交换 ， 该 位 置 邻 域 最 优 解 P, 的 值 为 17， 
为 了 在 交换 后 该 位 置 取 值 与 邻 域 最 优 解 P, 保持 一 致 ， 将 该 位 置 与 粒子 
取 值 为 17 的 位 置 交换 。 得 到 的 结果 为 粒子 的 新 的 位 置 下 + 

因为 粒子 以 一 定 概率 与 邻 域 最 优 解 的 排列 趋同 ， 所 以 如 果 其 与 邻 域 
最 优 解 的 排列 相同 时 ， 将 保持 不 变 。 为 了 避免 这 种 情况 ， 引 入 了 变异 来 
克服 ， 即 当 粒 子 与 邻 域 最 优 解 排列 相同 时 ， 随 机 选取 编码 中 的 两 个 位 
置 ， 交 换 其 位 值 ， 如 图 7. 8 所 示 。 
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pa 
EP le] [eyelet] 
AS 


图 7.8 变异 示意 图 
7.3.6 基于 遗传 策略 和 梯度 信息 的 几 种 改进 算法 


对 于 大 多 数 智能 优化 方法 来 说 ， 遗 传 策略 和 梯度 信息 的 使 用 是 两 类 
重要 的 改进 方式 。 因 为 遗传 算法 是 目前 为 止 应 用 最 为 广泛 的 智能 优化 方 
法 ， 其 基本 的 遗传 策略 ， 包 括 选 择 、 杂 交 和 变异 等 已 经 深入 人 心 并 且 取 
得 了 良好 的 优化 效果 ， 所 以 对 于 一 种 新 的 算法 ， 研 究 者 首先 会 想到 用 这 
样 的 策略 来 进行 尝试 ， 试 图 找到 性 能 改进 的 措施 。 梯 度 信息 是 传统 实 优 
化 中 所 使 用 的 重要 信息 ， 或 者 说 ， 传 统 实 优化 是 基于 梯度 信息 的 。 所 
以 ， 对 于 粒子 群 优化 算法 来 说 ， 针 对 那些 具有 梯度 信息 的 函数 优化 使 用 
梯度 信息 ， 必 然 大 大 提高 搜索 效率 。 这 里 介绍 一 些 基于 遗传 策略 和 梯度 
信息 的 改进 粒子 群 优化 算法 。 

1. 基于 选择 的 改进 算法 

标准 粒子 群 优化 算法 中 ， 粒 子 的 历史 最 优 信息 的 确定 相当 于 一 种 隐 
含 的 选择 机 制 。 在 邻 域 拓扑 结构 中 已 经 说 明 ， 这 种 选择 机 制 可 能 通过 较 
长 时 间 才 能 发 生 作用 。 而 传统 的 进化 算法 中 选择 的 方法 可 以 将 搜索 定向 
于 较 好 的 区 域 ， 合 理 地 分 配 有 限 的 资源 。 

Angeline 将 自然 选择 机 理 与 粒子 群 优化 算法 相 结合 ， 提 出 了 一 种 混 
合群 体 算法 (Hybrid Swarm) 。 该 混合 算法 是 采用 的 锦标 赛 选择 方法 
(Tournament Selection Method) ， 即 每 个 粒子 将 其 当前 位 置 上 的 适应 值 与 
其 他 个 粒子 的 适应 值 比较 ， 记 下 最 差 的 一 个 得 分 ， 然 后 整个 粒子 群 以 
分 值 高 低 排队 。 在 此 过 程 中 ， 不 考虑 个 体 的 历史 最 优 值 。 群 体 排序 完成 
后 ， 用 群体 中 最 好 的 一 半 的 当前 位 置 和 速度 来 替换 最 差 的 一 半 的 位 置 和 
速度 ， 同 时 保留 原来 个 体 所 记忆 的 历史 最 优 值 。 这 样 ， 每 次 送 代 后 ,一 
半 粒 子 将 移动 到 搜索 空间 中 相对 较 优 的 位 置 ， 这 些 个 体 仍 保留 原来 的 历 
史 信 息 ， 以 便于 下 一 代 的 位 置 更 新 。 

这 种 选择 方法 的 加 入 使 混合 算法 具有 更 强 的 搜索 能 力 ， 特 别 是 对 于 
当前 较 好 区 域 的 开发 能 力 ， 使 得 收敛 速度 加 快 。 但 是 ， 增 加 了 陷入 局 优 
的 可 能 性 。 
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2. 基于 交叉 的 改进 算法 
LOvbjerg 等 人 基于 进化 计算 中 交叉 的 思想 提出 了 带 有 繁殖 ( Breed- 
ing) 和 子 种 群 (Subpopulations) 的 混合 粒子 群 优化 算法 ， 这 里 研究 


者 使 用 的 是 繁殖 一 词 ， 与 交叉 同 义 。 这 种 混合 算法 的 结构 如 图 7.9 
所 示 。 


初始 化 
while (未 达 停止 条 件 )do 


m 
Tate 
动 
" 
end 


图 7.9 基于 交叉 的 混合 粒子 群 算法 结构 
这 里 ， 速 度 的 计算 方式 采用 的 是 惯性 权重 和 收缩 因子 相 结合 的 公 
R, WR (7.21) 所 示 
vu =k( ovu +E (Plu xu) +eanl Pra- xu) ) (7.21) 
移动 〈 即 新 位 置 的 计算 ) 方式 仍 为 式 (7.2) 。 
繁殖 的 方式 如 下 : 每 次 迭代 时 ， 依 据 一 定 的 概率 ( 称 为 繁殖 概率 ) 
在 粒子 群 中 选取 一 定数 量 的 粒子 放 人 一 个 池 中 ， 池 中 粒子 随机 两 两 进行 
繁殖 ， 产 生 相应 数目 的 子 代 粒 子 ， 并 用 子 代 粒 子 代替 父 代 粒 子 ， 使 种 群 
规模 保持 不 变 。 
每 一 维 中 子 代位 置 由 父 代位 置 进行 算术 交叉 计算 得 到 
child, (x,) =p, x parent, (x,) + (1.0 — p,) xparent,(x,) (7.22) 
child, (x,) =p, x parent, (x,) + (1.0 -p,) xparent,(x,) (7.23) 
这 里 ，P, 是 0，1 之 间 均 匀 分 布 的 伪 随 机 数 。 子 代 的 速度 向 量 由 父 
母 速度 向 量 之 和 归 一 化 后 得 到 


chita, (o) = ae) Paro paren Co) | (7.24) 


Tparent, (v) + parent, (v) | 
parent, (v) +parent,(v) 
[parent, (v) + parent, (v) | 

子 种 群 的 思想 是 将 整个 粒子 群 划分 为 一 组 子 种 群 ， 每 个 子 种 群 有 自 
己 的 内 部 历史 最 优 解 。 上 述 交叉 操作 可 以 在 同一 子 种 群 内 部 进行 ， 也 可 
以 在 不 同 子 种 群 之 间 进 行 。 交 叉 操 作 和 子 种 群 操作 ， 可 以 使 粒子 受益 于 
父母 双方 ， 增 强 搜索 能 力 ， 易 于 跳出 局 优 。 


child, (v) = |parent,(v)| | (7.25) 
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3. 基于 变异 的 改进 算法 

Higashi 和 Iba 将 进化 计算 中 的 高 斯 变异 融入 粒子 群 的 位 置 和 速度 的 
更 新 中 ， 来 避免 陷 人 局 优 。 每 个 粒子 在 搜索 区 域 移动 到 另 一 位 置 时 ， 不 
像 标准 公式 那样 只 依据 先 验 概率 ， 不 受 其 他 粒子 的 影响 ， 而 是 通过 高 斯 
变异 加 入 了 一 定 的 不 确定 性 。 变 异 的 计算 公式 为 

mut(x) =x x [1 +gaussian(o)] (7.26) 

Kp, mul) 为 变异 后 粒子 的 位 置 ， 取 o 为 搜索 空间 每 一 维 长 度 的 
0. 1 倍 ， 实 验 表明 o 取 此 值 时 效果 最 好 。 算 法 以 预定 的 概率 来 选择 变异 
个 体 ， 并 以 高 斯 分 布 来 确定 它们 的 新 位 置 。 这 样 ， 在 算法 初期 可 以 进行 
大 范围 的 搜索 ， 然 后 在 算法 的 中 后 期 通过 逐渐 减 小 变异 概率 来 改进 搜索 
效率 ， 作 者 将 变异 概率 设 定 为 从 1. 0 线性 减 小 到 0. 1。 

基于 高 斯 变异 的 混合 算法 更 容易 跳出 局 优 ， 因 此 在 求解 多 峰 函 数 时 
表现 出 更 好 的 性 能 。 

Stacey 等 人 尝试 了 使 用 Cauchy 分 布 来 进行 变异 操作 ， 其 概率 分 布 
函数 为 


fix) 2t. ud 


Tox a 

JP, 220.2, Cauchy 分 布 与 正 态 分 布 相似 ,但 是 在 尾部 有 更 大 的 概 
率 ， 这 样 可 以 增加 较 大 值 产生 的 概率 。 

并 且 ， 将 每 个 分 量 的 变异 概率 设 定 为 1/d， 这 里 d 为 向 量 的 维 数 。 

4. 带 有 梯度 加 速 的 改进 算法 

和 其 他 进化 算法 一 样 ， 标 准 粒子 群 优化 算法 利用 种 群 来 进行 随机 搜 
索 ， 没 有 考虑 具体 问题 的 特性 ， 不 使 用 梯度 信息 。 而 梯度 信息 往往 包含 
目标 函数 的 一 些 重要 信息 。 

对 于 函数 f(x) ,x = (x, ,x，,… ,x,)， 其 梯度 可 以 表示 为 


Vp) = LEGO, MD |. UD ys mane i AT Ro 


"A 

下 降 方 向 。 

王 俊 伟 等 通过 引入 梯度 信息 来 影响 粒子 速度 的 更 新 ， 构 造 了 一 种 带 
有 梯度 加 速 的 粒子 群 优化 算法 ， 每 次 粒子 进行 速度 和 位 置 的 更 新 时 ， 每 
个 粒子 以 概率 p 按照 式 (7.3) MAR (7.2) 进行 更 新 ; 以 概率 (1 -p) 
按照 梯度 信息 进行 更 新 ， 在 负 梯度 方向 进行 一 次 直线 搜索 来 确定 移动 步 
长 。 梯 度 加 速 的 流程 具体 如 图 7. 10 所 示 。 

直线 搜索 采用 了 黄金 分 割 法 ， 这 一 步骤 可 以 详 述 如 下 。 

产生 一 个 伪 随 机 数 ， 若 大 于 P， 则 按照 式 〈7.3) MA (7.2) 更 新 


(7.27) 
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产生 一 个 伪 随 机 数 a,ae U [0,1] 


技 公式 (7.3) 更 新 粒子 速度 
将 中 ! 方向 设 为 负 梯 度 方向 按 公式 (7.2) 更 新 粒子 位 置 


治 贮 ! 方 向 进行 直线 搜索 ， 得 到 xt 


图 7.10 梯度 加 速 的 流程 图 
粒子 速度 和 位 置 ; 否则， 
@D 试 探 方式 确定 一 单 谷 搜索 区 间 la, bl. 
DHH t, =a+B(b-a), f =f) o 
QW t =a+b-h, fi =f) o 


Qu, -6l<e，(e 为 终止 限 ) ， 则 了 人 即 为 粒子 的 下 一 位 置 ; 
TENHO. 

O3 f, «f, RAW, HAE, MED ut, =h, Aah, RE 
转 @; BM, Af Wash, tots f =f oa e| ca). 
=f), RERO 

同时 为 了 碱 小 粒子 陷入 局 优 的 可 能 性 ， 对 群体 最 优 值 进行 观察 。 在 
寻 优 过 程 中 ， 当 最 优 信息 出 现 停 潮 时 ， 对 部 分 粒子 进行 重新 初始 化 ， 从 
而 保持 群体 的 活性 。 

梯度 信息 的 加 入 使 粒子 的 移动 更 有 针对 性 ， 移 动 更 有 效率 ， 进 一 步 
提高 PSO 算法 的 收 华 速 度 ， 但 是 也 会 增加 算法 的 问题 依赖 性 ， 特 别 是 
有 些 问 题 的 梯度 信息 极 易 将 粒子 引入 局 优 。 所 以 带 有 樟 度 加 速 的 粒子 群 
优化 算法 需要 根据 问题 的 性 质 来 调整 梯度 信息 对 于 粒子 移动 的 影响 
程度 。 


7.3.7 约束 的 处 理 


智能 优化 方法 处 理 约束 的 一 般 性 策略 都 可 以 借鉴 到 粒子 群 算法 中 
来 ， 也 可 以 根据 粒子 群 优化 的 特性 来 设计 专门 的 约束 处 理 方式 。 下 面 是 
在 粒子 群 优化 算法 中 对 约束 处 理 方法 的 一 个 概述 。 详 细 内 容 可 以 参看 本 
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章 参考 文献 中 的 相关 部 分 [10, 11, 22, 25], 

1. 惩罚 策略 

粒子 群 优化 算法 解决 约 东 问题 ， 同 样 可 以 在 目标 函数 中 加 入 惩罚 函 
数 。 在 前 面 章节 中 已 经 说 明 过 ， 这 种 方法 的 主要 问题 在 于 设计 好 惩罚 函 
数 。 如 Parsopoulos 使 用 了 非 固定 多 阶段 指派 惩罚 函数 来 解决 约束 问题 。 

2. 拒绝 策略 

在 3.4.6 节 中 已 经 说 明 ， 拒 绝 策略 是 抛弃 进化 过 程 中 产生 的 所 有 不 
可 行 解 。Hu 和 Eberhart 根据 粒子 群 优化 算法 的 特点 又 进行 了 修改 ,来 
保持 解 的 可 行 性 : 粒子 在 整个 空间 进行 搜索 ， 但 是 只 保持 跟踪 那些 可 行 
的 解 来 加 速 它们 的 搜索 过 程 (拒绝 将 非 可 行 解 作为 历史 信息 ) ， 所 有 的 
粒子 被 初始 化 为 可 行 解 。 具 体 的 改进 步骤 可 以 描述 为 下 面 两 条 。 

(1) 初始 化 中 ， 所 有 的 粒子 被 重复 地 进行 初始 化 ， 直 到 满足 所 有 
的 约束 。 

(2) 在 计算 并 保留 个 体 和 邻 域内 的 历史 最 好 解 时 ， 只 保留 那些 满 
足 约束 的 解 。 

同 在 遗传 算法 中 所 讲 的 一 样 ， 上 述 方法 的 缺点 在 于 可 行 的 初始 种 群 
可 能 难以 找到 。 

El - Galled 等 也 使 用 了 类 似 的 方法 ， 但 是 在 粒子 飞 出 可 行 空间 时 ， 
将 粒子 重新 设置 为 过 去 找到 的 最 好 可 行 解 的 位 置 。 该 方法 的 缺点 在 于 ， 
可 能 导致 粒子 被 限制 在 初始 点 区 域 。 

3. 基于 Pareto 的 方法 

基于 Pareto 的 方法 源 于 解决 多 目标 优化 问题 ， 近 年 来 也 有 人 使 用 该 
方法 来 解决 约束 优化 问题 。 如 Ray 等 在 粒子 群 中 使 用 了 多 阶段 信息 共享 
策略 来 处 理 单 目 标 约束 问题 ， 就 是 利用 Pareto 排序 来 产生 共享 信息 。 

(1) 将 约束 处 理 为 约束 和 矩阵， 基于 此 和 矩阵， 使 用 Pareto 排序 来 产 
生 表现 好 的 粒子 ， 放 入 好 解 列表 (Better Performer List, BPL) Po 

(2) BPL 之 外 的 粒子 在 飞行 时 使 用 了 离 其 最 近 的 BPL 中 的 粒子 信 
息 。 即 一 个 BPL 中 的 粒子 和 其 附近 的 非 BPL 粒子 组 成 一 个 邻 域 。 

(3) 在 飞行 中 参考 邻 域 最 好 解 (Leader) 的 信息 时 ， 使 用 了 一 个 
简单 的 进化 算 子 代替 常规 公式 来 避免 早熟 。 即 变量 值 产生 于 粒子 本 身 和 
Leader 之 间 的 概率 为 50% ; 变量 值 产 生 于 变量 值 下 限 和 粒子 与 Leader 
最 小 值 之 间 的 概率 为 25% ; 变量 值 产生 于 变量 值 上 限 和 粒子 与 Leader 
最 大 值 之 间 的 概率 为 25% 。 

在 本 章 7.4. 1 节 的 应 用 实例 中 ， 将 详细 说 明 一 个 处 理 约束 问题 的 方 
法 。 


7.3 PSO 的 改进 与 变形 241 


7.3.8 多 目标 的 处 理 


应 用 粒子 群 优化 算法 解决 多 目标 问题 是 近年 来 的 研究 热点 之 一 。 有 
的 研究 者 借鉴 传统 的 进化 算法 解决 多 目标 的 方案 ， 如 基于 目标 加 权 和 向 
量 评价 方法 。 更 多 的 研究 是 根据 粒子 群 算法 的 特点 ， 通 过 选取 邻 域 最 优 
解 来 开发 基于 记忆 的 方法 。 根 据 目前 的 研究 情况 ， 将 这 些 方法 分 为 两 大 
类 ， 传 统 方法 和 基于 记忆 的 方法 。 下 面 进行 概括 性 的 介绍 。 

1. 传统 方法 

Parsopoulos 采用 了 两 种 传统 的 多 目标 处 理 方法 来 应 用 于 粒子 群 优化 
算法 求解 多 目标 问题 : 权重 和 方法 和 向 量 评价 法 。 具 体 方法 和 3. 4.7 节 
中 所 述 是 相同 的 。 

权重 和 方法 中 ， 采 用 了 传统 线性 加 权 方 法 、“ Bang - Bang” 加 权 方 
法 和 动态 加 权 方 法 。 

向 量 评价 方法 中 ， 首 先 利用 单 目 标 优化 函数 的 个 体 评价 方法 对 粒子 
进行 评估 ， 从 而 形成 不 同 的 子 种 群 ， 每 个 粒子 均 是 某 一 目标 函数 的 较 优 
解 。 粒 子 在 飞行 中 又 受到 其 他 子 种 群 信息 的 影响 ， 从 而 向 满足 其 他 目标 
函数 分 量 的 方向 飞行 ， 逐 渐 满足 更 多 的 目标 函数 分 量 ， 最 终 朝 着 Pareto 
最 优 方 向 飞行 。 

2. 基于 记忆 的 方法 

粒子 群 优化 中 信息 的 共享 机 制 与 其 他 基于 种 群 的 优化 工具 有 很 大 不 
同 。 遗 传 算法 中 通过 交叉 实现 信息 的 交换 ， 这 是 一 种 双向 的 信息 共享 机 
制 。 而 粒子 群 中 只 有 邻 域 最 好 解 将 其 信息 给 予 其 他 粒子 ， 这 是 一 种 单 向 
的 信息 共享 机 制 。 由 于 点 吸引 的 特性 ， 传 统 粒子 群 不 能 同时 向 多 个 
Pareto 最 优 解 靠近 。 虽 然 可 以 对 多 个 目标 使 用 不 同 的 权重 多 次 运行 算法 ， 
找到 Pareto 最 优 解 ， 但 是 最 好 的 办 法 还 是 同时 找到 Pareto 最 优 解 集 。 

作为 非 独立 的 智能 体 ， 粒 子 飞 行 时 个 体 和 邻 域内 的 历史 最 好 解 具有 
关键 性 的 作用 ， 所 以 解决 多 目标 优化 问题 ， 个 体 和 邻 域 最 优 解 的 选取 是 
关键 。 对 于 个 体 历史 信息 ， 可 以 让 粒子 记忆 更 多 的 Pareto 最 优 解 的 信 
息 。 目 前 的 研究 主要 集中 在 邻 域 最 优 解 的 选取 。 邻 域 最 优 解 的 选取 可 以 
分 为 两 个 步骤 。 

(1) 确定 邻 域 

也 就 是 确定 邻 域 的 拓扑 结构 ， 在 7.3.2 节 中 已 经 介绍 了 一 些 基本 的 
邻 域 策略 ， 在 多 目标 处 理 中 ， 也 可 以 使 用 一 些 特殊 的 邻 域 策 略 。 

(2) 从 邻 域 中 选取 一 个 表现 好 的 粒子 作为 最 优 解 

邻 域 最 优 解 的 选择 应 该 满足 两 个 原则 : 首先 ， 能 够 为 粒子 群 收敛 提 
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供 有 效 的 导向 作用 ; 其 次 ， 能 够 在 搜索 Pareto 解 集 和 保持 种 群 多 样 性 之 
间 保 持平 衡 。 文 献 中 的 方法 主要 包括 两 种 。 

"mi 

根据 某 个 规则 赋予 每 个 邻 域 中 候选 粒子 以 一 个 权重 ， 然 后 用 旋转 法 
随机 选择 。 这 样 能 够 保持 种 群 多 样 性 。 

@ 定 量 法 

使 用 一 些 具体 的 方法 来 定量 计算 得 到 邻 域 最 优 解 ， 而 不 是 随机 
选择 。 

关于 多 目标 处 理 的 详细 内 容 可 以 参看 本 章 参 考 文献 中 的 相关 部 分 
[4, 5, 12, 19, 21, 23, 26]。 


7.4 应 用 实例 


本 节选 取 了 两 个 应 用 实例 ， 即 网 络 广告 资源 优化 模型 和 新 产品 组 合 
投入 模型 ， 来 具体 说 明 粒 子 群 优化 算法 求解 过 程 。 网 络 广告 资源 优化 问 
题 的 求解 ， 主 要 是 说 明 粒子 群 优化 算法 如 何 来 解决 约束 问题 ; 新 产品 组 
合 投入 模型 的 求解 是 用 粒子 群 优化 算法 来 解决 离散 优化 问题 。 


7.4.1 网 络 广告 资源 优化 


1. 问题 的 提出 

这 里 ， 考 虑 门户 网 站 旗帜 类 广告 的 资源 优化 问题 。 假 设 一 个 门户 受 
理 了 nm 个 广告 业务 ， 记 为 4 =1，2，…，nm) 。 网 站 的 所 有 网 页 按 属 性 
分 类 ， 可 以 分 为 m 类， 用 1，2，…，i,…，m 表示 。 例 如 某 门户 网 站 
的 网 页 可 以 划分 为 主页 、 新 闻 、 体 育 、 娱 乐 、 游 戏 、 旅 游 、 文 化 等 。 定 
义 单个 网 页 的 日 访问 量 为 : 每 天 这 个 网 页 在 不 同 IP 地 址 用 户 的 浏览 器 
上 出 现 的 次 数 总 和 。 可 以 用 特定 的 软件 统计 属性 i 页面 的 平均 日 访问 
R, WA ko dy RAH EMM i 下 的 显示 概率 ，c; 表 示 在 特定 属性 
页 面 i 下 广告 j 的 点 击 概率 ,cy 可 以 通过 统计 历史 数据 得 出 。 而 h 表示 
广告 客户 所 要 求 的 广告 显示 率 。 

2. 数学 模型 

下 面 介绍 一 个 最 大 化 广告 效果 函数 的 优化 模型 ， 优 化 配置 广告 资 
源 。 广 告 效 果 由 广告 点 击 率 的 大 小 指示 。 因 为 通常 情况 下 ， 广 告 被 点 击 
意味 着 广告 已 呈现 在 用 户 面前 ， 用 户 看 到 了 他 感 兴趣 的 信息 。 为 了 避免 
线性 规划 中 出 现 广告 显示 率 过 于 集中 在 某 几 类 页 面 ， 而 增加 广告 与 顾客 
的 接触 面 ， 同 时 通过 视觉 刺激 发 挥 广告 树立 品牌 的 作用 。 所 以 在 最 大 化 
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广告 总 体 点 击 次 数 的 基础 上 加 入 了 一 个 分 散 惩罚 项 ， 将 广告 显示 率 分 散 
到 不 同 的 网 页 ， 

max (o> Dp -25 Sea > x4) (7.28) 
其 中 ， 目 标 函 数 中 的 第 二 项 的 最 大 值 ( 即 去 掉 负 号 后 的 最 小 值 ) 是 在 
各 个 必 相 等 时 取得 ， 所 以 第 二 项 起 到 了 将 广告 让 分散 于 不 同属 性 页 的 作 
用 。 两 个 权 值 w, 和 w,(w, + os =1) ， 规 定 了 第 一 项 和 第 二 项 在 目标 函 
数 中 将 起 多 大 作用 。 同 时 满足 下 面 的 约束 : 


st Y kd, = hy 了 = 1 
fa 


SY dy =l i=l,m (7.29) 
fA 
d; 20 (7.30) 


约束 方程 的 含义 为 : @ 广 告 在 各 种 属性 页 面 的 印 次 总 数 达 到 广告 主 
HER; @ 所 有 广告 在 各 个 属性 页 面 的 显示 概率 之 和 等 于 1; OTRE 


率 非 负 。 当 约束 方程 满足 5 h; = 5 k Rf, EFENI WRR 


等 价 于 非 线性 运输 问题 。 
3. 使 用 粒子 群 优化 算法 求解 
本 文 模型 中 约束 为 线性 方程 组 ， 可 行 域 狭小 ， 因 此 难以 设计 一 个 合 
适 的 惩罚 函数 。 如 果 惩 罚 较 大 ， 则 惩罚 后 的 目标 函数 将 不 连续 ; 惩罚 较 
小 时 ， 得 到 的 最 优 解 可 能 在 可 行 集 外 。 并 且 ， 算 法 的 大 部 分 时 间 耗 费 在 
从 非 可 行 域 跳 到 可 行 域 的 运算 中 ， 运 算 效率 低 。 因 此 ， 本 文 不 用 惩罚 函 
数 ， 而 根据 约束 集 和 粒子 群 优化 算法 的 特点 ， 设 计 每 一 步 迭 代 粒 子 都 可 
行 的 粒子 群 优化 算法 。 
(1) 粒子 的 初始 化 
首先 ， 用 矩阵 表达 决策 变量 d, (i1, o, m 且 j=1, =, n) 的 
集合 ， 描 述 如 下 : 
d, ^ d, 
dao `| 


粒子 坐标 就 用 D = | di} 表示， 描述 粒子 在 ma 维 空间 中 的 运动 位 
置 ， 而 粒子 的 运动 速度 可 由 和 矩阵 V= {vs| 表示 。 根 据 表 上 作业 法 中 初始 
基 可 行 解 的 确定 方法 ， 得 到 下 面 的 随机 初始 化 过 程 ， 产 生 满足 约束 条 件 
BIR (7.29) 和 式 (7.30) 的 初始 粒子 。 
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初始 化 1: 
Input Array h[j], for j=1, =, n 
Array ali] =1andk [i], for i=l, =, m 
Begin 
设 定 集合 Ag = 11,2, mn] 
repeat 
从 集合 中 随机 选 一 个 数 r$ 
计算 相应 的 行 和 列 ; 


izInt((r-1)/(n*1)); 
j=(r-1)mod(n +1); 

4 d[i][j] 2 minCa[ i] ,hLj]/kCi]) s 
修改 数据 

ali] =a[i] -alil [j]; 

A[j] =h[7] - 4L [Iklil 

集合 Ag=Ag\ irl; 

until 集合 Ag 为 空 
End 

初始 化 过 程 1 产生 一 个 满足 约束 条 件 的 粒子 D= | dy| ， 这 是 一 个 至 
多 有 m+n -1 个 非 零 元 素 的 矩阵 ， 表 示 凸 可 行 解 空间 的 顶点 ， 对 应 约 
东 集 中 的 基 可 行 解 。 

注 : 这 里 的 初始 化 过 程 与 表 上 作业 法 确定 初始 基 可 行 解 的 方法 区 别 
是 , 初始 化 1 是 随机 选择 变量 ， 而 表 上 作业 法 根据 最 小 运 价 或 最 大 的 运 
价差 额 (最 小 运 价 与 次 最 小 运 价 的 差额 ) 来 选择 变量 。 所 以 初始 化 1 
得 到 的 是 运输 问题 的 基 可 行 解 ， 它 对 应 可 行 解 空间 的 项 点， 可行 域 中 的 
任意 一 点 都 能 用 项 点 的 凸 组 合 来 表示 。 

为 了 求解 最 优化 问题 如 式 (7.28) 所 示 ， 需 要 设计 可 保持 粒子 可 
行 性 条 件 的 速度 。 由 问题 可 行 集 和 粒子 群 优化 算法 中 粒子 速度 、 位 置 更 
新 公式 的 特点 ， 推 导出 以 下 定理 。 

定理 7.1 如 果 可 行 粒子 的 初始 速度 了 满足 条 件 


y ko, 20 了 = 1 
& 


X wy=0, isl e,m (7.31) 


则 按 更 新 公式 (7.2) 迭代 ,得 到 的 粒子 满足 约束 条 件 即 式 
(7.29), 
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证 明 : 设 可 行 粒子 D= {dy} (i=l, =, m; j=l, =, n), Hk 
(7.2) 更 新 后 得 到 粒子 (d; ev), RAR (7.2), HAR 
(7.31), "18 


Y kilda +o) = Y kd, = hy jel,,n 
a 各 


Š dy tv = 5 d,=1 i=1,=,m 
所 以 更 新 后 的 粒子 (di v) 满足 约束 条 件 即 式 (7.29), W 7.148 
证 。 

定理 7.2 定义 为 mw -w(di -dy)(i=1,…,m;j=1,.…,n,weR) 
的 速度 使 得 式 (7.31) 成 立 ， 其 中 dv 和 dv 分别 是 两 个 可 行 粒子 D, 和 
D, 的 位 置 分 量 。 

证 明 : w =w(dis -dy) 代入 约束 条 件 (7.31) 左边 ,可 得 

Y oko, 2wY kd,-wY kd, = wh, -wh -0,j-l,-,n 

加 | e 各 

DE dy -wy dj =w-w=0, i=1l,,m 

A 名 fi 

B, V- ivl 满足 式 (7.31), ÆA 7.2 得 证 。 

由 定理 7. 1 和 定理 7.2 可 得 下 面 的 推论 。 

推论 7.1 如 果 每 个 粒子 的 各 个 分 量 都 采用 相同 的 和 mn， 并 且 初 
始 速度 满足 式 (7.31) ， 则 按照 式 (7.3) MR (7.2) 更 新 的 粒子 总 是 
满足 约束 条 件 即 式 (7.29). 

因此 ,为 了 在 每 一 步 迭 代 中 都 获得 满足 约束 条 件 即 式 (7.29) 的 
粒子 群 ， 不 但 要 产生 满足 约束 的 可 行 粒子 ,还 需 产生 满足 式 (7.31) 
的 初始 速度 。 由 定理 7.2， 可 以 通过 初始 化 过 程 1 产生 可 行 粒子 ， 来 获 
得 满足 式 (7.31) 的 初始 速度 。 

初始 化 2: 

Begin 

运用 初始 化 1， 得 到 一 群 可 行 粒子 (至 少 为 mn 4) 
Repeat 
随机 从 粒子 种 群 中 取出 两 个 粒子 D[p] 和 D[g]， 
4 V[k] =(D[p] -D[q])/(g *rand() +0.2), 其 中 p， 
ge |1,…,Num| ,ge R，( 根 据 具体 问题 确定 ) 
k=k+1; 
until k>Num (粒子 群体 规模 ) 
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End 
FP, rand () 为 [0, 1] 区 间 内 的 伪 随 机 数 。 

(2) 算法 步 又 

BS: 运用 初始 化 1 初始 化 一 群 粒子 (群体 规模 为 Num) dj; 
并 且 运 用 初始 化 2， 得 到 初始 速度 ， 设 定 初始 个 体 历史 最 优 解 pe 和 和 群 
体 历史 最 优 解 gw。( 适 值 和 位 置 同时 设 定 ) 。 注 意 在 初始 化 2 中 得 到 了 
一 群 新 的 粒子 。 

588235. 计算 每 个 粒子 的 适 值 。 

第 3 步 : 对 于 每 个 粒子 ， 将 其 适应 值 与 其 经 历 过 的 最 好 位 置 pn 作 
比较 ， 并 且 检 验 这 个 粒子 的 可 行 性 条 件 式 〈7. 30) ， 如 果 这 个 粒子 的 适 
值 较 好 且 满 足 由 >=0， 则 将 其 作为 当前 的 最 好 位 置 ne (粒子 的 适 值 和 
位 置 同时 设 定 ) 。 

第 4 步 : 对 于 每 个 粒子 ， 将 其 适应 值 与 全 局 所 经 历 的 最 好 位 置 gu 
作 比 较 ， 并 且 检 验 粒子 的 可 行 性 条 件 式 (7. 30) ， 如 果 这 个 粒子 适 值 较 
好 且 满 足 必 >0， 则 将 其 设 为 gw (粒子 的 适 值 和 位 置 同 时 设 定 ) 。 

第 5 步 : 根据 式 (7.3) 变化 粒子 的 速度 ,为 满足 约束 即 式 
(7.29) 令 每 个 粒子 各 个 分 量 的 和 值 相 等 。 然 后 设 定 一 个 小 的 正 数 
s =10…。 如 果 一 个 粒子 的 速度 小 于 e 并 且 在 20 步 的 迭代 中 仍 保持 小 于 
s， 则 重新 初始 化 速度 和 位 置 并 重新 设 定 pu 为 当前 的 dys ARTE Eren 
不 变 。 然 后 根据 式 (7.2) 变化 粒子 的 位 置 。 

第 6 步 : 如 未 达到 结束 条 件 (通常 为 足够 好 的 适应 值 或 达到 一 个 
预 设 最 大 代数 C。..) ， 则 返回 第 2 步 。 

上 述 算法 与 标准 粒子 群 优化 算法 区 别 如 下 。 

(1) 对 于 约束 的 处 理 ， 首 先 产生 可 行 的 初始 粒子 和 可 行 速度 ,保证 
每 次 迁 代 的 粒子 群 满足 约束 条 件 即 式 (7.29); 其 次 ,为 了 同时 满足 约束 
条 件 即 式 7.30) ， 在 第 3 步 和 第 4 步 比较 适 值 时 ， 加 入 了 可 行 条 件 即 式 
(7.30) 的 判断 ， 只 有 当 粒 子 同时 满足 适 值 较 好 和 d,20 时 ， 才 将 此 粒子 
TEX pu 或 gu， 这 样 就 避免 了 粒子 向 适 值 较 好 的 非 可 行 解 方向 运动 。 

(2) 加 入 动态 调整 机 制 。 通 常 当 粒 子 群 运行 到 一 定 的 阶段 ， 将 会 
收敛 到 稳定 状态 ， 此 时 所 有 粒子 将 聚集 到 一 起 ， 粒 子 的 调整 速度 越 来 越 
小 ,逐渐 趋 于 零 。 所 以 此 时 应 重新 初始 化 速度 和 位 置 ， 令 粒子 恢复 活 
力 ， 发 挥 寻 优 的 作用 。 

4. 计算 实例 

算法 用 JDK1.3 实现 , 在 P4 1.8 G, 256 M 计算 机 上 对 多 个 问题 
进行 了 成 功 的 仿真 ， 证 明了 算法 的 有 效 性 。 下 面 以 规模 为 10 个 属性 页 ， 
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20 个 广告 的 问题 为 例 。 随 机 产生 20 组 数据 ， 每 组 数据 运算 50 次 。 其 
中 ， 目 标 函数 中 的 参数 y 取 值 为 0.02 ( 若 太 大 ， 就 成 为 目标 函数 中 的 
主要 起 作用 部 分 了 ) ， 算 法 参数 设 为 : w =0.5, c, =0.7, c, =0.7。 
第 上 组 数据 近 优 值 中 最 好 的 记 为 opti,, ， 最 差 的 记 为 optrin H k H 
数据 第 ! 次 计算 得 到 的 目标 值 记 为 op o 
图 7.11 中 ,1 表示 0<e<0.05 的 计算 结果 占 全 部 计算 结果 的 百 分 
HE; 2 表示 0.05 <e<0.1 所 占 的 百分比 ; 3 表示 O.1«6x0.25 所 占 的 
百分比 ; 4 表示 0.25 «e 所 占 的 百分比 。 
误差 结果 分 布 图 


图 7.11 误差 结果 分 布 图 
GE: 计算 代数 为 10 000， 粒 子 的 种 群 规模 为 100) 

计算 © = Copt, — opti) / Coptz,, -opttis) 作 为 所 得 近 优 解 的 误差 ， 计 
算 所 有 近 优 解 的 误差 ， 并 统计 误差 在 0~5%、5% ~10%、10% ~25% 
与 大 于 25% 各 占 的 比率 ， 标 示 如 图 7. 11 所 示 。 误 差 基 本 在 25% 之 内 ， 
说 明 计算 的 结果 大 部 分 集中 在 最 好 值 附 近 。 另 外 ， 计 算 20 组 数据 
optss/optkss 的 比值 的 平均 值 为 0. 909 ， 标 准 差 为 2. 262 7， 说 明 最 差 值 与 
SREB 09 4 25. 1096 左右 。 所 以 总 的 来 说 算法 的 优化 效果 还 比较 好 。 

同时 仿真 结果 也 表明 当 计 算 的 代数 较 大 (> 10 000) ， 种 群 规模 较 
大 时 ， 算 法 的 效果 较 好 。 由 于 变量 较 多 ， 基 可 行 解 空间 的 基数 目 (为 
171) 较 大 ， 所 以 种 群 的 规模 较 大 时 ， 算 法 才能 发 挥 其 效力 。 

限于 篇 幅 ， 取 一 组 数据 下 得 到 的 最 优 结果 和 达 优 率 列 于 表 7. 1 和 表 
7.2, 


表 7.1 优化 结果 
ARKA 
粒子 个 数 
1 000 5 000 10 000 
20 822.3 833 860.45 
100 852.12 860. 61 861.08 
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表 7.2 BRB (%) 


BRAK 
粒子 个 数 
1000 5 000 | 10 000 
20 32.40 49.00 | s% 


100 81. 80 91. 40 93. 01 


7.4.0 新 产品 组 合 投入 问题 


下 面 首 先 来 介绍 一 个 非 线 性 半 无 限 规划 的 相关 新 产品 组 合 投入 模 
型 ， 然 后 用 粒子 群 优化 算法 来 求解 。 

1. 新 产品 投入 模型 

(1) 产品 收益 曲线 

产品 的 生命 周期 分 为 四 个 阶段 ， 即 投入 期 、 增 长 期 、 成 熟 期 和 衰退 
期 。 对 于 产品 i， 其 收益 函数 如 图 7. 12 所 示 ， 可 表达 为 

fO) sate, te[0, T], i=1, 2, +, n (7.32) 

其 中 a, Mb, i21, 2, c, n, NEST 

给 定 下 列 市 场 预测 值 ; 

Pp: 一 一 产品 能 够 达到 的 最 大 销售 额 即 峰 值 。 
达到 峰值 时 间 。 
就 可 确定 参数 c Mb 如 下 : 


Ti 


该 函数 较 好 地 表达 了 产品 生命 周期 的 四 个 阶段 。 选 择 不 同 参数 就 可 
获得 不 同类 型 的 产品 。 
LO 


图 7.12 新 产品 的 收益 曲线 
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(2) 新 产品 组 合 投入 模型 
变量 和 函数 定义 如 下 : 
mn 一 待 投入 新 产品 个 数 。 
第 ;种 产品 (i=1，2，…，m) 的 投入 成 本 。 
:一 时 间 变 量 。 
f) 一 第 i 种 产品 的 收益 曲线 。 
(dy, do] 一 第 i 种 产品 的 最 佳 投入 期。 
a 一 产品 在 最 佳 投 入 期 之 前 投入 时 的 单位 时 间 提 前 惩罚 率 (可 以 
理解 为 投资 贴现 率 ) 。 
p 一 一 产品 在 最 佳 投入 期 之 前 投入 时 的 单位 时 间 的 拖 期 惩罚 率 。 
有 一 产品 之 间 的 相关 系数 (相关 收益 率 ) (1 m1 <1)。 
的 含义 如 下 : 
区 >0 时 ， 表 示 产 品 i，j 是 互补 产品 ; 
=0 时 ， 表 示 两 个 产品 不 相关 ; 
已 <0 时 ， 表 示 产 品 i, 是 互 为 替代 产品 ， 且 有 7; = ms 
7 一 企业 制定 新 产品 投入 的 计划 期 ， 即 :的 变化 区 间 为 【1，7]。 
zi 一 产品 ;的 投入 时 间 (为 整形 变量 ) ， 其 定义 如 下 : 


ei 


mel (1, T], Pah i EMAL N, 投入 (7.33) 
“0, 产品 i 不 在 计划 期 内 投入 
并 定义 向 量 
X2[5,,x,77,x,] 
及 符号 函数 
sgn(x) -人 iin (7.34) 
KBEAREN, Fh i ASCP ae Ha OS 
f(t) = [1 -B(x -da)’ MG 7x) (7.35) 
其 中 
(x-y)' 2sgn(x-y) 
定义 下 面 的 符号 函数 
Sr(x,,x,,t) = sgn(x,) sgn(x,) sgn(1 - x, ) sgn(t xj) (7.36) 
则 产品 间 相 关 收 益 为 
FAX) = Y Sr(sum Or Gu) f) (7.37) 


函数 S(t) Al p(t) 的 说 明 如 下 : 
S(t): 企业 的 目标 收益 曲线 。 
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p(t): 现 有 产品 的 收益 曲线 。 
HP, SO) 的 定义 为 
S(t) =s(1+r)‘ 
At, s 为 当年 收益 目标 ，r 为 增长 率 。 
因为 开始 投 人 时 间 定 在 现 有 产品 的 成 熟 期 ， 现 有 产品 的 收益 曲线 可 
表示 为 
p(t) =a exp( - £728) /(b 2) 
如 果 用 p 表示 现 有 产品 当年 利润 额 ，g 表示 了 年 内 总 利润 额 的 预测 
值 ， 很 容易 得 出 
a =2q,b =2q/(p 2) 
令 
g(t) =S(t) -p(t) 
并 考虑 到 提前 惩罚 ， 则 组 合 投 和 人 模型 为 


min X sgn(x,) [1 +a(d - x,) Je, (7.38) 


s.t Y sgn(x,)fi,(t) +fr(t,X) 2 g(t), Yt e [1,7] (7.39) 
x, € |0,1,2,-, TI ,i=1,2,-+,n (7.40) 
5k (7.38) ~ 式 (7.40) 是 一 个 非 线性 的 半 无 限 规划 模型 。 当 上 在 区 
间 [1,7] 中 取 无 限 个 值 时 , 式 (7.39) 有 无 限 个 约束 。 下 面 使 用 粒子 群 优 
化 算法 来 求解 。 
2. 粒子 群 优 化 算法 结构 
(1) 编码 方法 
本 问题 中 编码 方法 采用 投入 时 间 向 量 作为 粒子 表达 方式 , 即 
X2[x,,5 x] 
代表 一 个 粒子 。 其 中 ,x, HR 07.33) EM IFA x, 允许 重复 。 
(2) 评价 函数 
采用 动态 标定 方法 : 
设 Fw 为 本 代 粒 子 中 目标 函数 的 最 大 值 , 将 目标 函数 转化 为 


za = max| Fua- 》 sgn(x,)[1 &a(d, 72) ' Jeil 
SARRAR, MAER 

AQO = min [S sef) +f(1,X) -ECD] 
menasa 。 
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F(X) = {z,,, +Mh(X), 0} (7.41) 
其 中 ，M 为 一 个 随和 迭代 次 数 变化 的 参数 ， 迭 代 开始 时 M 较 小 ， 即 对 不 
可 行 解 的 惩罚 较 小 ， 可 以 保证 粒子 的 多 样 性 ; 随 着 迭代 数 的 增加 ，M 
逐渐 增 大 ， 即 对 不 可 行 解 的 惩罚 加 大 ， 保 证 算法 向 最 优 解 方向 收敛 。 
(3) 粒子 运动 公式 
本 算法 中 的 粒子 向 量 是 由 整数 构成 的 ， 所 以 采用 下 列 公 式 对 粒子 操 


f£: 
Inter (pa 754) ter (pa -Xa)), TOS 
"E (7.42) 
Int( Random (0, T)), ET 
xu 2 Mod( | x4 +041) (7.43) 


其 中 ,c。 为 [0, 1] 之 间 的 常数 ， 用 来 确定 采取 传统 运动 或 是 随机 扰 
动 。 学 习 因 子 c, c, 是 非 负 常数 ，m，m ，m 为 介 于 [0, 1] 之 间 的 随 
PLR. Int (+) 为 取 整 函数 ，Random (0, T) 为 取 0 ~ 了 之 间 的 随机 
数 ， 是 一 个 随机 扰动 ， 能 够 起 到 遗传 算法 中 变异 的 作用 。 这 里 整数 了 
表示 计划 期 。Mod (+) 表示 以 7 为 模 求 余数 ， 其 目的 是 防止 粒子 向 量 
元 素 超出 边界 ， 函 数 中 的 绝对 值 是 保证 非 负 性 。 
R (7.42) 的 含义 为 : 当 产 生 的 随机 数 小 于 co 时 进行 如 下 操作 : 
v4 = Vig + Int(er (pa — x4) + ers (Pye 一 xu)) (7.44) 
否则 
v, = v4 + Int( Rondom(0,T) ) (7.45) 

(4) 最 优选 择 与 终止 准则 

保存 历史 最 好 解 ， 指 定 最 大 代数 作 停止 准则 。 即 选 一 个 大 的 正 整数 
NG 为 最 大 的 代数 ， 若 和 迭代 指标 丰 大 于 WCG， 则 停止 迭代 并 输出 历史 最 好 
解 作为 最 终 的 结果 。 

3. 算法 步骤 

算法 步骤 如 下 : 

第 1 步 : 设置 终止 代数 NG、 粒 子 群 规模 m、 学 习 因 子 co, 4, 5 
置 上 =0; 随机 生成 初始 粒子 群 POP(0) = |X' ,XY,…,X"|; 设置 初始 历 
史 最 好 解 X'“ ， 及 初始 历史 最 优 目标 值 F(“ ) 。 

第 2 步 : 计算 每 个 粒子 的 评价 函数 值 ， 比 较 得 到 粒子 自身 经 历 过 的 
最 好 位 置 P,， 及 全 局 经 历 过 的 最 好 位 置 P,。 

第 3 步 : 按 运动 公式 (7.42) 进行 上 述 提 到 的 粒子 操作 。 

第 4 步 : 如 果 k<NG, k=k+1; BM, BRK, 输出 全 局 历史 
最 好 解 。 
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4. 仿真 实例 


BS 个 待 投 入 产品 ， 考 虑 在 未 来 12 个 季度 (3 年 ) PRA MR 
通过 市 场 预测 得 到 如 表 7. 3 所 示 的 结果 ， 为 计算 方便 ， 所 有 数值 均 不 计 


单位 。 
表 7.3 待 投入 新 产品 的 参数 
Selen auge emm | 最 早报 入 | mega mad 
2s (25,) 时 间 (da) 时 间 (da) (s) 
1 180 25 RR EE" 90.0 
2 130 E 2 6 170.0 
3 155 2 2 9 127.5 
4 166 1.4 1 5 75 
5 us 2.3 6 10 20 
6 100 13 3 8 40 
7 160 28 3 7 50.5 
8 175 1.5 9 12 40 
9 95 4.3 3 8 90 
10 60 2.2 5 9 40 
u 120 1.8 1 6 50.0 
12 165 2.5 2 6 88 
13 155 m 4 9 76.5 
m 175 m 5 8 65 
15 185 DE 5 8 100 


现 有 产品 投入 当 季度 的 利润 额 为 180，7 时 间 内 总 利润 额 的 预测 值 


351000; 企业 当 季度 的 目标 收益 为 180， 季 度 增长 率 为 0. 1。 


去 掉 全 是 0 的 行 和 列 ， 简 化 和 产品 相关 系数 矩阵 如 表 7.4 所 示 ， 其 
中 第 一 列 和 第 一 行 表示 产品 号 。 


LA 产品 相关 系数 阵 


产品 序号 1 4 5 9 15 
1 0 0.25 -0.15 -0.1 0.21 
4 0.25 0 -0.1 -0.10 0.23 
5 -0.15 -0.1 0 0.18 -0.12 
9 -0.1 -0.10 0.18 0 -0.12 
15 0.21 0.23 -0.12 -0.12 0 
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设 提前 惩罚 系数 a =0. 1， 拖 期 惩罚 系数 B =0.01。 
给 定 NG =100, «20.9, c, = cy =2， 及 粒子 群 规模 m = 80， 经 过 
几 次 运算 ， 得 到 如 表 7.5 所 示 的 最 好 解 。 
表 7.5 计算 结果 
最 好 解 最 优 目 标 值 
1000713 00705 0 il 8 541.50 


计算 结果 显示 ， 在 考虑 了 产品 相关 系数 后 ， 只 有 2 个 产品 在 最 佳 投 
入 期 之 外 投入 ， 其 中 ,产品 6 在 最 佳 投 入 期 之 前 投入 ， 使 总 的 投入 成 本 
增加 ， 而 产品 14 在 最 佳 投 入 期 之 后 投入 ， 会 损失 一 些 市 场 份额 或 收益 。 
但 满足 了 企业 的 目标 收益 。 其 他 产品 都 在 最 佳 投入 期 之 内 投入 。 

实验 结果 表明 ， 针 对 该 模型 设计 的 粒子 群 优化 算法 能 够 处 理 大 规模 
非 线性 半 无 限 规划 ， 并 且 计 算 速 度 优 于 遗传 算法 ; 粒子 群 优化 算法 对 求 
解 组 合 优化 问题 是 一 个 简单 有 效 的 方法 。 


问题 与 思考 


1. 对 于 以 下 无 约束 优化 问题 : 


min f(x) = > {x} - 10cos(2mx,) + 10] 


其 中 ， 初 值 范围 : [ -5.12, 5.12]^, n =30， 目 标 达 优 值 为 100。 

试 分 别 用 遗传 算法 和 粒子 群 优化 算法 设计 其 解决 方案 ,并 夯 出 算法 流程 图 。 

2. 异步 时 变 的 学 习 因子 一 般 与 线性 减 小 的 时 变 惯性 权重 配合 使 用 ， 在 这 种 参 
数 设置 方式 下 ， 若 学 习 因 子 c, 的 变化 范围 为 : [2.5, 0.5], c, 的 变化 范围 为 : 
[0.5，2.5] 。 惯 性 权重 的 变化 范围 为 : [0.9，0.4]。 最 大 迭代 次 数 为 4 000。 试 计 
算 ， 当 惯性 权重 为 0. 8 和 0.5 时 ， 两 种 学 习 因子 分 别 如 何 取 值 ? 当时 ,粒子 的 探索 
和 开发 能 力 哪 个 占 主导 地 位 ? 粒子 的 两 种 学 习 能 力 哪 个 占 主导 地 位 ? 

3. 试 为 惯性 权重 设计 一 种 非 线性 的 变化 方式 ， 使 其 在 粒子 群 搜索 的 初期 以 较 
慢 的 速度 减 小 ， 在 搜索 的 中 期 以 较 快 的 速度 减 小 ， 而 在 搜索 的 后 期 又 以 较 慢 的 速度 
减 小 。 从 而 动态 调节 粒子 群 的 探索 和 开发 能 力 。 

4. 粒子 群 优化 算法 和 蚁 群 优化 算法 是 群体 智能 的 两 个 代表 性 算法 ， 试 分 析 其 
异同 。 

5. 试 使 用 粒子 群 优化 算法 为 旅行 商 问题 设计 一 套 解决 方案 。 
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第 8 章 捕食 搜索 算法 


捕食 搜索 (Predatory Search， 简 称 PS) 算法 是 由 巴西 学 者 Alexan- 
dre Linhares 在 1998 年 提出 来 的 一 种 用 于 解决 组 合 优化 问题 的 模拟 动物 
捕食 行为 的 空间 搜索 策略 。Alexandre Linhares 把 捕食 搜索 策略 分 别 应 用 
于 解决 旅行 商 问题 (TSP) 和 超大 规模 集成 电路 设计 (VLSI 问题 都 
取得 了 较 好 的 效果 。 后 来 刘 崇 ， 汪 定 伟 和 蒋 忠 中 等 又 将 该 算法 进行 了 改 
进 以 及 应 用 ， 都 取得 了 较 好 的 效果 。 

下 面 介 绍 捕食 动物 在 搜索 过 程 中 的 行为 特征 。 

关于 捕食 动物 的 搜索 行为 的 研究 构成 了 例如 生态 学 、 生 物 学 和 动物 
行为 学 的 主线 。 这 些 研究 将 捕食 动物 的 搜索 过 程 分 为 三 个 不 同 的 部 分 
@ 首 先 ， 捕 食 动物 必须 为 了 捕食 而 搜索 ; @ 和 然后， 捕食 动物 追逐 和 攻击 
猎物 ; 图 最 后 ， 处 理 并 吃 掉 猎 物 。 当 然 ， 不 同 的 捕食 动物 在 每 一 个 步骤 
中 需要 不 同 的 消耗 。 以 狮子 为 例 ， 因 为 它们 捕食 的 是 斑马 或 者 胜 羚 一 
形体 较 大 容易 被 发 现 ， 在 搜索 的 过 程 中 不 需要 太 多 的 消耗 。 对 于 这 样 的 
猎 食 者 来 说 ， 它 们 在 追逐 和 攻击 阶段 (攻击 者 可 能 有 意外 发 生 ) 以 及 
进食 阶段 (其 他 动物 可 能 参与 分 享 猜 物 ) 需要 更 多 的 消耗 。 而 对 于 鸟 
类 或 者 蜥 蝎 等 捕食 小 昆虫 的 动物 来 说 ， 由 于 昆虫 较 小 的 形体 〈 有 时 小 
于 捕食 者 的 1% ) 很 难 被 发 现 ， 搜 索 的 过 程 需要 很 大 的 消耗 。 对 于 这 些 
捕食 动物 来 说 ， 搜 索 阶 段 比 攻击 和 处 理 阶段 重要 得 多 。 自 然 选 择 的 过 程 
使 这 些 动物 进化 出 了 有 效 的 搜索 策略 。 

对 于 搜索 过 程 有 重要 需求 的 捕食 动物 来 说 ， 其 最 知名 的 搜索 策略 如 
下 。 在 没有 发 现 猎物 和 猎物 的 迹象 时 在 整个 捕食 空间 沿 着 一 定 的 方向 以 
很 快 的 速度 寻找 猎物 ， 一 旦 发 现 猎物 或 者 发 现 有 猎物 的 迹象 ， 它 们 就 立 
即 改 变 自己 的 运动 方式 ， 减 慢 速度 ， 不 停 地 巡回 ， 在 发 现 猎物 或 者 有 猎 
物 迹象 的 附近 区 域 进 行 集中 的 区 域 搜索 ， 持 续 不 断 地 接近 猎物 。 在 搜寻 
一 段 时间 没 有 找到 猎物 后 ， 捕 食 动 物 将 放弃 这 种 集中 的 区 域 ， 而 继续 在 
整个 捕食 空间 寻找 猎物 。 这 就 是 著名 的 区 域 限制 (Area-Restricted) 的 
搜索 策略 ， 在 不 同 的 物种 如 鸟 类 、 蜥 蝎 、 许 多 的 捕食 昆虫 等 行为 中 都 有 
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描述 。 这 一 捕食 行为 看 上 去 对 于 不 同 的 环境 和 猎物 分 布 都 是 适应 的 和 有 
效率 的 。 例 如 ， 如 果 猿 物 在 搜索 空间 内 是 聚集 的 或 者 随机 分 布 的， 区 域 
限制 搜索 能 够 通过 在 猎物 附近 进行 持续 的 搜索 从 而 最 大 化 搜索 成 功 的 概 
率 。 如 图 8. 1 所 示 ， 动 物 的 这 种 捕食 过 程 中 的 搜索 策略 可 以 概括 为 以 下 


两 个 搜索 。 
常规 搜索 
(在 整个 捕食 空间 内 ) 


图 8.1 动物 的 捕食 策略 

搜索 1 (常规 搜索 ) : 在 整个 搜索 空间 进行 全 面 搜索 ， 直 到 发 现 猎 
物 或 者 有 猎物 的 迹象 而 转 到 搜索 2 进行 区 域 限制 搜索 。 

搜索 2 〈 区 域 限制 搜索 ) : 在 猎物 或 者 有 猎物 的 迹象 的 附近 区 域 进 
行 集中 搜索 ， 直 到 搜索 很 多 次 也 没有 找到 猎物 而 放弃 局 域 搜索 ， 转 到 搜 
索 1 进行 常规 搜索 。 

动物 学 家 的 进一步 研究 表明 ， 动 物 的 这 种 捕食 搜索 策略 的 效率 是 
很 高 的 。 这 是 由 于 ， 除 了 简单 和 通用 的 特性 ， 此 策略 很 好 地 平衡 了 对 
整个 猎物 空间 的 探索 (在 整个 解 空间 进行 全 面 搜索 ) 和 对 猎物 聚集 区 
域 的 开发 在 发 现 猎物 的 附近 区 域 进行 集中 搜索 )。 全 面 的 搜索 可 以 
发 现 猎 物 聚 集 的 区 域 ， 为 集中 搜索 提供 搜索 的 区 域 ， 并 能 避免 陷入 猫 
物 稀少 的 区 域 ; 集中 的 搜索 可 以 在 猎物 集中 的 区 域 仔细 地 搜索 猎物 ， 
防止 漏 掉 猎物 。 由 于 捕食 者 大 部 分 时 间 用 在 猎物 聚集 区 ， 而 猎物 聚集 
区 相对 于 整个 搜索 空间 更 容易 发 现 猎物 ， 所 以 动物 的 这 种 捕食 策略 是 
很 高 效 的 。 关 于 动物 捕食 搜索 策略 的 详细 说 明 可 以 参见 文献 [1，3 
4, 5, 10, 12]. 
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8.2 基本 原理 


这 里 以 TSP 问题 这 一 典型 的 组 合 优化 问题 为 例 来 说 明 捕 食 搜索 算 
法 的 实现 。 


8.2.1 捕食 搜索 算法 的 基本 思想 


模拟 动物 的 这 种 捕食 过 程 中 的 搜索 策略 ，Alexandre Linhares 提出 了 
一 种 新 的 针对 组 合 优化 问题 的 仿生 算法 ， 即 捕食 搜索 (PS) 算法 ， 如 
图 8. 2 所 示 。 应 用 捕食 搜索 算法 寻 优 时 ， 先 在 整个 搜索 空间 进行 全 局 搜 
索 ， 直 到 找到 一 个 较 优 解 ;然后 在 较 优 解 附近 的 区 域 进行 集中 搜索 ， 直 
到 搜索 很 多 次 也 没有 找到 更 优 解 ， 从 而 放弃 局 域 搜索 ; 然后 再 在 整个 搜 
索 空间 进行 全 局 搜索 。 如 此 循环 ， 直 到 找到 最 优 解 〈 或 近似 最 优 解 ) 
为 止 。 在 捕食 搜索 算法 中 ， 使 用 限制 (Restriction) 来 表征 较 优 解 的 邻 
域 大 小 。 通 过 限制 的 调节 ， 实 现 搜索 空间 的 增 大 和 减 小 ， 从 而 达到 探索 
能 力 和 开发 能 力 的 平衡 。 


找到 更 好 的 解 ? 
N 


图 8.2 捕食 搜索 算法 
捕食 搜索 算法 不 是 一 种 具体 的 寻 优 计算 方法 ， 并 没有 给 出 在 局 域 和 
全 局 如 何 进行 具体 的 搜索 ， 其 本 质 上 是 一 种 平衡 局 域 搜索 和 全 局 搜索 的 
策略 ， 所 以 可 将 其 称 为 捕食 搜索 策略 。 局 域 搜索 和 全 局 搜索 ,广度 探索 
和 深度 开发 ， 搜 索 速 度 和 优化 质量 是 困扰 着 所 有 算法 的 矛盾 。 而 捕食 搜 
索 非 常 巧妙 地 平衡 了 这 个 矛盾 。 捕 食 搜索 在 较 差 的 区 域 进 行 全 局 搜索 以 
找到 较 好 的 区 域 ， 然 后 在 较 好 的 区 域 进行 集中 地 局 域 搜索 ， 以 使 解 得 到 
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迅速 地 改善 ; 捕食 搜索 的 全 局 搜索 负责 对 解 空间 进行 广度 探索 ， 捕 食 搜 
索 的 局 域 搜索 负责 对 较 好 区 域 进行 深度 开发 ;捕食 搜索 的 局 域 搜索 由 于 
只 集中 在 一 个 相对 很 小 的 区 域 进行 搜索 ， 所 以 搜索 速度 很 快 ， 捕 食 搜索 
的 全 局 搜索 可 以 提高 搜索 的 质量 ， 使 搜索 避免 陷 人 局 部 最 优点 。 


8.2.2 算法 的 实现 


FRU TSP 问题 为 例 ， 说 明 算法 的 实现 。 

1. 算法 中 的 基本 概念 

把 组 合 优化 问题 定义 为 一 个 二 元 组 (2，Z) ， 这 里 如 是 解 的 集合 ， 
KAZ: 02 一 R 代表 每 个 解 到 对 应 的 适应 值 的 变换 。 假 设 每 个 解 ; 存在 
一 个 邻 域 N(s) CO, EX N'G) CNG) , 这 里 N'(s) 包含 了 N(s) 中 
元 素 的 5% 。N(s) 中 一 个 解 到 另 一 个 解 的 变换 称 为 一 个 移动 。 

在 规模 为 n 个 城市 的 TSP 问题 中 ， 用 由 从 1 到 的 n 个 自然 数组 成 
的 集合 中 的 每 个 元 素 表示 城市 ， 元 素 所 在 的 位 置 表示 被 访问 的 顺序 。 例 
如 ， 状 态 * = (ay, aay cns ox). 表示 旅行 商 访问 的 路 线 为 

3, —3,—7—5,—3, 

一 个 解 为 一 个 巡回 路 线 ， 给 定 一 个 解 *， 采 用 2 - opt 法 进行 状态 的 

转移 ， 即 将 其 子 串 


倒转 得 到 

S a an 
则 得 到 一 个 新 的 解 ， 其 中 : 1<9，9qg +r<n。 组 合 所 有 可 能 的 9 和 7 就 得 
到 :的 邻 域 NM(s) o 


如 果 对 于 任何 两 个 状态 和 s。， 和 某 个 RE 有， 存在 一 个 序列 
So. Sis S23. 778 Sm-is Sm 

车 对 于 所 有 正 整 数 0<k <m， 有 s e NO), WEISE sn EK so 可 
达 的 。 

如 果 对 某 个 ReR， 对 于 路 径 上 的 所 有 状态 有 Z(s,) <R， 则 称 这 条 
路 径 服从 限制 (Restriction) R。 因 此 可 以 将 函数 4: QxR 一 2? 定义 为 
JA s 可 达 的 服从 限制 R 的 所 有 解 的 集合 4(s，R) CO. RR, BE 
个 最 好 解 和 一 个 限制 R， 围 绕 b 的 一 个 受 限 搜索 区 域 可 以 表示 为 
A(b, R) CD。 为 了 实现 一 个 在 已 知 最 好 解 附近 的 逐渐 扩大 的 搜索 区 
域 ， 可 以 定义 一 个 由 NumLevel + 1 个 限制 级 别 组 成 的 序列 : 限制 CL], 
这 里 Le {0，1，…，NumLevel}， 称 为 限制 的 级 别 (Level of the Restric- 


tion) 。 
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图 8.3 给 出 了 一 个 解 空间 的 示意 图 ， 在 已 经 找到 的 最 优 和 解 的 附近 ， 
使 用 限制 来 区 分 不 同 大 小 的 搜索 空间 。 图 8. 3 中 ， 解 被 表示 为 标 有 数字 
WE, Æ Z 坐标 上 的 投影 为 其 相应 的 适应 值 。 需 要 指出 的 是 算法 不 能 
把 这 张 图 在 记忆 中 保存 ， 只 能 够 根据 当前 解 运行 并 动态 计算 其 可 能 的 邻 
域 。 在 图 8.3 中 ， 解 1 为 全 局 最 优 解 ， 但 是 算法 中 并 没有 限制 从 图 8. 3 
中 某 一 个 解 的 邻 域 里 发 现 具 有 更 好 适应 值 的 解 *。 图 8. 3 中 也 给 出 了 搜 
索 区 域 中 的 一 些 限制 : 在 限制 [3] 的 范围 内 ， 解 1 拥有 一 条 到 达 解 12 
的 路 径 ， 而 在 限制 [2] 的 范围 内 解 则 不 能 到 达 解 12。 对 于 解 1 来 说 ， 
在 不 同 的 限制 下 相应 的 邻 域 空间 中 解 的 集合 为 


限制 [0]: {1}; 
限制 [1]: (1,215 
限制 [2]: {1, 2, 4, Os 


限制 [3]: 图 中 的 所 有 解 。 


限制 [3] 


限制 [2] 


限制 [1] 


限制 [0] 


图 8.3 解 空间 示意 图 

算法 的 主要 迭代 来 自 搜索 1， 从 邻 域 中 取样 ， 如 果 样品 中 的 最 好 解 
的 适应 值 小 于 限制 上 ， 那 么 将 其 作为 新 的 解 ， 重 新 开始 。 出 于 可 操作 性 
的 考虑 ， 算 法 的 每 步 取样 取 一 个 较 小 的 子 集 ， 即 邻 域 的 5% 。 没 有 将 整 
个 集合 N(s) 作为 考察 样本 的 原因 : 这 是 一 个 耗 时 为 0(n*) 的 操作 ; 
@ 将 使 算法 成 为 不 具 可 行 性 的 操作 ， 导 致 无 限 的 循环 。 需 要 注意 的 是 ， 
邻 域 中 的 最 好 解 即 使 其 适应 值 大 于 当前 解 也 会 被 接受 ， 当 移动 出 一 个 局 
优 之 后 ， 算 法 必然 还 会 返回 该 点 ， 因 为 该 点 是 邻 域 Ns) 中 的 最 好 解 。 

每 一 次 尝试 性 的 移动 之 后 ， 有 一 个 指针 来 记录 在 该 区 域内 迭代 的 次 
数 。 当 指针 到 达 一 个 关键 点 之 后 ， 增 加 限制 的 等 级 L， 从 而 不 断 加 大 搜 
索 的 区 域 。 当 L 到 达 某 一 个 值 Lthreshold 时 ， 意 味 着 算法 已 经 在 所 限制 
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的 区 域内 进行 了 多 次 有 效 的 搜索 而 没有 找到 改进 的 解 〈Improving Solu- 
tion) ， 于 是 算法 放弃 区 域 限 制 的 搜索 方式 ， 将 工 设置 为 一 个 较 高 的 值 
LhighThreshold。 这 个 较 高 的 值 表示 在 建立 一 列 取样 时 得 到 的 一 个 较 差 解 
的 适应 值 ， 在 这 样 一 个 限制 的 约束 下 ,算法 可 以 搜索 很 大 的 区 域 ， 很 快 
跳出 原来 所 限制 的 较 小 的 区 域 。 

当 发 现 一 个 改进 的 解 时 ， 需 要 一 些 特殊 的 操作 。 

(1) 若 找到 更 好 的 解 则 更 新 最 优 解 5。 

(2) 从 4 的 邻 域 中 计算 得 到 一 列 限制 等 级 〈 具 体 后 述 ) 。 

(3) 将 工 设 为 0， 从 而 让 算法 在 4 的 附近 进行 细致 的 搜索 。 

这 也 正 是 区 域 限 制 的 搜索 方式 被 触发 的 时 刻 ， 这 里 的 捕食 搜索 策略 
的 实现 可 以 看 做 是 捕食 改进 的 解 (Improving Solution) ， 而 不 是 捕食 很 
好 的 解 (Very Good Solution) 。 另 一 个 可 行 的 触发 区 域 搜索 的 方式 可 以 
是 在 常规 搜索 中 发 现 较 好 的 解 (即使 其 不 优 于 当前 的 最 好 解 )， 这 样 的 
触发 条 件 将 弱 于 前 述 方式 。 

2. 算法 步骤 

第 1 步 ; 随机 选择 一 个 初始 点 solution, solution e N, 4 b = 
solution, counter =0, L=0, 

38235: WIL <NumLevel, W N(s) fj 590 HH N'(s) , EROR 
中 最 小 解 proposal， 然 后 转 第 3 2b; 否则 结束 。 

第 3 步 如 果 proposal e A(b, Restriction [ L]) ， 令 solution = propos- 
ol， 然后 转 第 4 步 ; 否则 转 第 5 步 。 

第 4 步 : 如 果 Z(solution) <Z(b), 令 b = solution, level =0，counter = 
0， 重 新 计算 限制 ， 然 后 转 第 2 步 ; 否则 转 第 5 步 。 

第 5 He: 令 counter = counter + 1， 如 果 counter > Cthreshold, & 
上 = 上 +1，counter =0， 然 后 转 第 6 步 ; 否则 转 第 2 步 。 

9856 46: WMF L = Lthreshold, 4 L= LhighThreshold, 35698 2 步 ; 
否则 直接 转 第 2 步 。 

这 里 ，Restriction [L] 表示 限制 ， 其 他 相关 符号 的 定义 ， 见 算法 概 
念 中 的 描述 。 

3. 限制 的 计算 

上 述 第 4 步 中 ， 如 果 Z(soluion) <Z(b)， 重 新 计算 限制 ， 具 体操 
WTF: 

(1) 搜索 NumLevel 次 迄今 为 止 发 现 的 最 好 解 b 的 邻 域 ,计算 Z, 
得 到 NumLevel 个 适应 值 。 

(2) 把 这 NumLevel 个 值 与 发 现 的 最 好 解 的 适应 值 按照 升序 排列 。 
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(3) 把 排列 后 的 NumLevel 个 值 依 次 赋 给 限制 Restriction. [1], 
Restriction [2], +++, Restriction [ NumLevel] ij Restriction [0] 的 值 取 
为 刚 获得 的 最 好 的 适应 值 Z (0). 

4. 参数 的 设置 

在 上 述 的 算法 实现 中 , 文献 [2] 已 经 设置 了 一 些 特殊 的 参数 ， 这 
里 做 以 下 说 明 。 

(1) 每 一 步 搜索 时 评估 邻 域 中 解 的 比例 。 邻 域 中 可 能 的 解数 量 为 
0.5(m -n) ， 这 里 是 取 邻 域 中 解 的 5% 进行 评估 。 

(2) NumLevel; 总 的 限制 级 别 数 为 NumLevel + 1， 文 献 [2] 中 
NumLevel WH no 

(3) Cthreshold: 用 于 增 大 限制 等 级 了 的 指针 阔 值 。 文 献 [2] PR 
置 为 3n。 如 果 在 某 个 限制 等 级 下 ， 搜 索 了 Cthreshold 次 〈 搜 索 一 次 即 取 
样 5% ) 仍 没 有 找到 改进 的 解 ， 那 么 将 增 大 限制 等 级 Lo 

(4) Lthreshold; ?4 L 93k Lthreshold 时 ， 意 味 着 算法 已 经 在 所 限制 
的 区 域内 进行 了 多 次 有 效 的 搜索 而 没有 找到 改进 的 解 ， 于 是 算法 放弃 区 
域 限制 的 搜索 方式 ， 在 文献 [2]. 中 将 其 设置 为 [n/20], 这 里 [] 为 
取 整 运算 符 ， 即 区 域 限制 搜索 模式 的 限制 等 级 数 为 城市 总 数 被 20 I 
结果 的 整数 。 

(5) LhighThreshold, 表示 一 个 较 高 的 适应 值 ， 文 献 [2] 中 取 为 
n- [n/20] 。 即 在 常规 搜索 模式 下 ， 如 果 算 法 在 [n/20] 个 限制 等 级 
下 搜索 过 后 仍 不 能 发 现 新 的 改进 的 解 ， 那 么 算法 将 停止。 

从 上 面 的 参数 设置 可 以 看 到 ， 在 文献 [2] 中 区 域 限制 的 搜索 和 常 
规 搜索 中 经 历 的 限制 等 级 数 都 为 [n/20] ， 具 体 如 下 : 

对 于 区 域 限制 搜索 来 说 ， 限 制 等 级 为 

0，1，2，…，[n/20] -1; 
对 于 常规 限制 搜索 来 说 ， 限 制 等 级 为 
n- [n/20], n- [n/20] +1, n- [n/20] +2, =, n-1 


8.2.3 捕食 搜索 算法 的 应 用 条 件 


无 可 否认 ， 只 有 当 猎 物 聚 集 时 ， 捕 食 者 采用 这 种 策略 效率 才 高 。 可 
以 想象 ， 当 猜 物 分 布 很 扩散 而 且 没 有 规律 时 ， 捕 食 者 进行 局 域 搜索 只 能 
无 功 而 归 。 同 样 ， 捕 食 搜索 也 只 有 在 较 好 解 聚集 时 才 有 效 。 特 别 当 较 好 
解 聚集 于 全 局 最 优点 时 ， 捕 食 搜索 的 搜索 效率 很 高 。 

UCLA 的 Boese K D, Kahng A B 和 Muddu S HHAH? (Greedy 
Descent Algorithm) 求解 了 100 个 城市 Euclidean 旅行 商 问题 的 2 500 个 局 
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部 最 优 解 和 G (150, 0.5) 的 二 分 图 问题 的 2 500 个 局 部 最 优 解 ， 并 分 
别 分 析 了 这 两 个 问题 的 2 500 个 局 部 最 优 解 之 间 的 关系 (它们 的 各 自 的 
巡游 路 线 长 度 和 它们 之 间 的 距离 的 关系 ) ， 得 出 结论 : 旅行 商 问题 和 二 
分 图 问题 的 较 好 的 局 部 最 优 解 聚 集 于 全 局 最 优 解 。 

此 后 Coventry 大 学 的 Reeves C R 求解 了 20/5/F/c,,, KI Bi KF i 
问题 的 50 个 局 部 最 优 解 ， 然 后 分 析 了 它们 的 函数 值 与 它们 和 已 知 的 全 
局 最 优 解 的 距离 之 间 的 关系 ， 并 得 出 了 相同 的 结论 。 以 上 详细 说 明 见 参 
考 文献 [2，11] 。 

由 此 可 以 得 出 结论 : 捕食 搜索 是 适合 于 求解 旅行 商 问题 (Traveling 
Saleman Problem，TSP) ， 二 分 图 问题 (Graph Bisection) 和 流水 车 间 问 
题 (Flow - shop Sequencing) 等 组 合 优化 问题 的 。 


8.2.4 计算 举例 


五 城市 非 对 称 TSP 问题 ， 设 五 个 城市 分 别 为 : 1, 2, 3, 4, 5, E 
离 矩阵 为 


0856 7 
608 59 
D=(d,) =|7 9 05 6 
97805 
56780 


为 简化 计算 该 问题 的 过 程 ， 相 关 参 数 设 置 如 下 : 

(1) 每 一 步 搜索 时 评估 邻 域 中 解 的 数量 为 2。 

(2) NumLevel =5。 

(3) Cthreshold =1。 

(4) Lthreshold =1。 

(5) LhighThreshold =4。 

邻 域 定义 如 8. 2.2 节 所 示 。 

算法 开始 ， 随 机 取 一 个 初始 点 : 

solution (1, 2, 3, 4, 5) 

则 6 = solution, counter =0， 上 L=0。 初 始点 的 适应 值 为 
Z(b) =Z(solution) =8 +8 +5 +5 =26 
然后 来 计算 限制 ， 随 机 取 solution 邻 域 中 的 五 个 解 为 
s,=(2, 1, 3, 4, 5) 

5, 2(1, 2, 4, 3, 5) 

$, 2 (3, 2, 1, 4, Sy 
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s,=(1, 2, 5, 4, 3) 

s,=(1, 5, 4, 3, 2) 

计算 其 相应 的 适应 值 为 

Z(s) =6+5+5+5=21 

Z(s,) =8+5+8+6=27 

Z(s) =9+6+6+5=26 

Z(s,) =8+9+8+8=33 

Z(s)27484849-32 

所 以 ， 得 到 相应 的 限制 为 

Restriction [0] =26 

Restriction [1] =21 

Restriction [2] =26 

Restriction [3] =27 

Restriction [4] =32 

Restriction [5] =33 

至 此 ， 得 到 了 第 一 列 限制 ， 邻 域 搜索 的 准备 工作 完毕 。 下 面 是 捕食 
搜索 的 过 程 ， 从 最 小 限制 Restriction [0] 开始 。 

(1) 第 一 列 限制 中 的 Restriction [0] RAF, solution 的 邻 域 进行 
第 一 次 搜索 。 

随机 取 solution 的 邻 域 中 的 两 个 解 为 

(2，1，3，4，5)， 其 适应 值 为 21 

(1，3，2，,，4，5)， 其 适应 值 为 24 

故 proposal =(2, 1, 3, 4, 5), 又 Z(proposal) =21 < Restriction[0] =26 

所 以 ，solution = (2，1，3，4，5)， 令 b=solution， 重 新 计算 限制 。 

随机 取 solution 邻 域 中 的 五 个 解 为 

a 2(1, 2, 3, 4, 5) 

5,2(2,1, 4, 3, 5) 

552(3,1, 2, 4, 5) 

s,=(2, 1, 5, 4, 3) 

$,2(2, 5, 4, 3, 1) 

计算 其 相应 的 适应 值 为 

Z(s)) =8+7+6+5=26 

Z(sj) =6+6+8+6=26 

Z(sj)) =7 +8+5+5=25 

Z(s,) =6 +7 +8 +8=29 
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Z(sj) =9 +8 +8 +7 =32 

所 以 ， 得 到 相应 的 限制 为 

Restriction [0] =21 

Restriction [1] =24 

Restriction [2] =25 

Restriction [3] =26 

Restriction [4] =29 

Restriction [5] =32 

至 此 得 到 了 第 二 列 限 制 。 

(2) 第 二 列 限制 中 的 Restriction [0] 限制 下 ，solution 的 邻 域 进行 
第 一 次 搜索 。 

随机 取 solution 的 邻 域 中 的 两 个 解 为 

(2,1,4,3, 5), ENA 24 

(2, 1, 3, 5, 4), FENA 25 

Kk proposal = (2, 1, 4, 3, 5), X Z (proposal) = 24 > Restriction 
[0] =21， 不 更 新 solution, counter = counter +1 21, 

(3) 第 二 列 限制 中 的 Restriction [0] 限制 下 ，solution 的 邻 域 进行 
第 二 次 搜索 。 

再 次 搜索 solution = (2, 1, 3, 4, 5) 的 邻 域 。 随 机 取 solution 的 
邻 域 中 的 两 个 解 为 

(3，1，2，4，5) ， 其 适应 值 为 25 

(2, 4, 3, 1, 5) ， 其 适应 值 为 27 

所 以 proposal = (3, 1, 2, 4, 5) 

Hi Z( proposal) = 25 > Restriction [0] =21， 于 是 不 更 新 solution, 
counter = counter+ 1 =2 > Cthreshold =1， 到 达 了 指针 阐 值 ， 所 以 增 大 限 
WER, L=L+1=1, 计数 器 清 零 (counter =0) 。 

(4) 第 二 列 限制 中 的 Restriction [1] 限制 下 ，solution 的 邻 域 进行 
第 一 次 搜索 。 

在 solution 的 邻 域内 随机 取 两 个 解 为 

(2，1,，5,4，3)， 其 适应 值 为 29 

(4,3, 1, 2, 5), ， 其 适应 值 为 32 

所 以 proposal =(2, 1, 5, 4, 3), HH Z( proposal) = 29 > Restriction 
[1] 224, REY solution, counter = counter +1 21, 

(5) 第 二 列 限制 中 的 Restriction [1] 限制 下 ，solution 的 邻 域 进行 
第 二 次 搜索 。 
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在 solution 的 邻 域内 随机 取 两 个 解 为 

(2,5, 4，3，1) ， 其 适应 值 为 32 

(5, 4，3，1，2) ， 其 适应 值 为 31 

所 以 proposal = (5, 4, 3, 1, 2), 由 于 Z (proposal) = 31 > 
Restriction [1] 224, ARES solution, counter = counter «1 =2 > 1， 所 以 
增 大 限制 等 级 并 且 令 counter =0, L2 L 122» Lthreshold =1， 所 以 结束 
邻 域 限制 搜索 ， 令 了 = LhighThreshold =4， 下 面 将 开始 常规 搜索 ， 即 广 
域 搜索 。 

(6) 第 二 列 限制 中 的 Restriction [4] 限制 下 ，solution 的 邻 域 进 行 
第 一 次 搜索 。 

取 solution 邻 域 中 的 两 个 解 为 

(3，1，2，4，5) ， 其 适应 值 为 25 

(5, 4, 3，1，2) ， 其 适应 值 为 31 

proposal =(3, 1, 2, 4, 5), Z(proposal) = 25 < Restriction[4] =29, 
所 以 solution = proposal, hH F Z( solution) 225 » Z(b) =21， 所 以 不 更 新 最 
优 解 b。 

令 counter = counter +1 =1， 再 次 进行 局 域 搜索 ， 即 第 二 列 限制 中 的 
Restriction [4] 限制 下 ，solution 的 邻 域 进行 第 二 次 搜索 。 

从 上 面 的 计算 过 程 ， 可 以 看 到 : 

@ 算 法 初始 阶段 ， 由 于 初始 解 随机 选取 ， 导 致 Restriction [0] 可 能 
大 于 Restriction [1]， 但 是 邻 域 选 优 的 结果 将 使 Restriction [0] 快速 
下 降 。 

@ 在 第 6 步 中 ， 即 第 二 列 限制 中 的 Restriction [4] 限制 下 ，solution 
的 邻 域 进行 第 一 次 搜索 后 ， 得 到 的 proposal 虽然 没有 优 于 已 知 最 优 解 ， 
但 是 由 于 其 小 于 当前 的 限制 ， 所 以 当前 的 解 solution 仍然 移动 到 proposal 
处 ， 这 将 使 捕食 搜索 具有 跳出 局 优 的 能 力 。 


8.3 改进 与 变形 


通过 设置 限制 缩小 搜索 空间 ， 提 高 搜索 效率 ， 是 捕食 搜索 的 精华 
之 所 在 。 所 以 ， 限 制 方法 的 选取 也 就 成 为 影响 捕食 搜索 算法 搜索 效率 
的 一 个 关键 因素 。 如 果 限 制 太 宽 ， 搜 索 区 域 变 大 ， 将 花费 很 多 时 间 才 
能 找到 较 好 解 ; 如果 限 制 太 窄 ， 较 好 解 可 能 不 在 搜索 区 域 里 ， 而 导致 
解 得 不 到 改善 。Linhares A 在 其 初始 的 捕食 搜索 算法 中 ， 使 用 了 解 的 
函数 值 (Restricted by Solution Cost) 作为 限制 ， 来 实现 搜索 空间 大 小 
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的 变化 。 

刘 崇 等 分 析 认为 ， 用 函数 值 作 为 限制 有 时 可 能 导致 搜索 的 效率 低 和 
搜索 的 盲目 性 ， 并 提出 了 使 用 距离 限制 的 捕食 搜索 算法 ， 即 利用 与 迄今 
为 止 发 现 的 最 好 解 之 间 的 距离 对 算法 的 搜索 空间 进行 限制 。 并 且 将 改进 
算法 应 用 于 解决 TSP 问题 和 流水 车 间 调 度 问 题 。 这 里 同样 以 TSP 问题 
为 例 介绍 使 用 距离 限制 的 捕食 搜索 算法 。 


8.3.1 TSP 巡游 路 线 之 间 的 距离 


TSP 巡游 路 线 之 间 的 距离 根据 不 同 的 定义 有 两 种 表示 方法 。 

(1) 2 - opt 距离 (2 -opt Distance) 

2 - opt 距离 d(t,, t) 定义 为 从 4 通过 2 - opt 邻 域 变换 变 为 1, 的 最 
小 变换 次 数 。 

(2) Bond 距离 (Bond Distance) 

Bond BERE b(t,, t) 定义 为 用 城市 数 n CS 0, 5 相同 的 边 数 。 

这 里 采用 第 二 种 距离 定义 ， 即 Bond 距离 。 


8.3.2 算法 步骤 
第 1 步 : 随机 选择 一 个 初始 点 solution, solution e N, 4 b = solu- 


tion, counter 20, L0, 

58235. MRL <Numlevel, 取 N(s) 的 10% 构造 出 N'(s) ， 并 取 
其 中 最 小 解 proposal， 然 后 转 第 3 步 ; 否则 结束 。 

38 3 步 : 计算 proposal 与 b 之 间 的 Bond 距离 。 

第 4 步 : 如 果 Bond (proposal, b) < Restriction [了 ] ， 令 solution = 
proposal, RARR 5 步 ; 否则 转 第 6 步 。 

385 步 : 如 果 Z (solution) « Z (b), 4 b = solution, level =0， 
counter =0， 重 新 计算 限制 ， 然 后 转 第 2 步 ， 否 则 转 第 6 步 。 

第 6 步 : 4 counter = counter + 1， 如 果 counter > Cthreshold, 4 L = 
了 +1，counter =0， 然 后 转 第 7 2b; 否则 转 第 2 步 。 

第 7 步 : 如 果 了 = Lthreshold, 4 L = LhighThreshold, 3+ 4% 2 步 ; 
否则 直接 转 第 2 步 。 


8.3.3 限制 的 计算 


该 算法 的 限制 条 件 是 固定 的 值 ， 不 随 历 史 最 优 解 的 变化 而 变化 。 也 
可 以 取 一 组 升序 的 数组 作为 限制 ， 对 算法 的 搜索 区 域 进行 分 级 限制 。 由 
于 解 之 间 的 距离 本 身 就 是 相对 于 当前 最 好 解 的 距离 ， 所 以 当 发 现 新 的 最 
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好 解 时 ， 也 不 用 重新 计算 限制 。 以 下 操作 只 在 算法 初始 化 时 执行 。 

@ 把 2，12，…，[n/2] -8 赋 给 Restriction[0] ，Restriction[1]，…， 
Restriction[ [n/20] -1]; 

Qi [n/2] 赋 给 其 余 的 限制 。 


8.3.4 参数 的 设置 


文献 [4] 对 上 述 算法 中 的 参数 设置 如 下 。 

@D 每 一 步 搜索 时 评估 邻 域 中 解 的 比例 。 即 邻 域 搜索 的 数目 ， 设 为 整 
个 邻 域 的 10% ， 为 0.05n (n-1), 

QyNumLevel; 也 取 为 no 

图 Crhreshold: 也 设置 为 3n。 

@Lthreshold: 也 设置 为 [n/20] 。 即 对 于 区 域 搜索 ， 限 制 的 等 级 从 
0 到 [n/20 -1] ， 等 差 为 1。 

@LhighThreshold: 文献 [4] PWH n- [n/40]。 对 于 全 局 搜索 ， 
限制 的 等 级 从 [n-n/40] 到 n-1， 等 差 也 为 1。 

注意 算法 的 参数 设置 ， 不 难 发 现 ， 在 全 局 搜索 过 程 中 ， 变 形 算法 的 
限制 水 平 的 级 数 是 局 域 搜索 中 限制 水 平 级 数 的 一 半 。 这 样 的 设置 意味 
AE, VA Bond 距离 为 限制 的 捕食 搜索 算法 更 注重 了 局 域 搜索 。 


8.4 应 用 实例 


8.4.1 电子 商务 中 物流 配送 路 径 优化 的 问题 描述 与 模型 


B2C 电子 商务 中 物流 配送 路 径 优化 模型 的 基本 思想 可 描述 如 下 
(本 例 源 于 文献 【13 ] ) : 根据 B2C 电子 商务 企业 在 某 个 时 段 内 顾客 的 
订货 情况 〈 如 顾客 商品 需求 量 和 其 地 理 位 置 )， 利 用 信息 技术 〈 如 GIS 
技术 ) 确定 该 时 段 的 实际 配送 网 络 ， 通 过 优化 设计 一 套 基 于 配送 网 络 
的 车 辆 路 径 ， 同 时 要 满足 一 系列 的 约束 条 件 〈 如 商品 需求 量 、 配 送 中 
心 和 车 辆 容量 限制 等 ) ， 使 得 配送 总 费用 最 小 。 这 里 总 费用 包括 车 辆 配 
送 费用 和 车 辆 一 次 性 启动 费用 。 为 了 便于 建立 模型 ， 将 实际 物流 配送 网 
络 用 由 配送 中 心 和 顾客 两 类 节点 构成 的 不 完全 无 向 图 表示 ， 并 作 以 下 几 
个 基本 假设 : 

@ 配 送 中心 有 多 个 ， 每 个 配送 中 心 各 类 商品 量 以 及 配送 车 辆 数 一 
定 。 每 辆 车 仅 隶 属于 一 个 配送 中 心 。 

四 每 个 顾客 仅 能 由 一 个 配送 中 心中 的 一 辆 车 进行 一 次 性 商品 配送 ， 
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但 可 以 被 多 次 访问 。 特 殊 地 ， 如 果 顾 客 需求 超出 一 辆 车 的 容量 则 选择 最 
和 近 可 用 的 配送 中 心 由 多 辆 车 对 其 进行 配送 ， 因 而 此 类 情况 在 通过 数据 预 
处 理 后 亦 可 由 模型 表示 。 

图 每 辆 车 从 各 自 的 配送 中 心 出 发 ， 完 成 配送 任务 后 返回 自己 所 在 的 
配送 中 心 。 

图 配送 商品 为 多 品种 商品 ， 配 送 车 辆 为 单一 类 型 车 辆 。 

下 面 给 出 B2C 电子 商务 中 物流 配送 路 径 优 化 的 数学 模型 : 


Mind’ 2 P Cdixa + > Max(z,) (8.1) 
por 


st D xo- > x4 20,Vpe S,keK, (8.2) 
nn nun 
Y tazı, VjeDkekK (8.3) 
GDeE 
Sm =1,VieD (8.4) 
ft 
PES <A,,VpeS (8.5) 
2 (Q ra < Vke K (8.6) 
Say -Va <0, VieS,leL (8.7) 
E 
xa 70, VieH,jeH,kek (8.8) 
和 =0,1 VieSjeD (8.9) 
za 70, VjeD,.keK (8.10) 
模型 中 符号 有 两 类 ， 即 模型 的 决策 变量 和 模型 参数 。 
(1) 决策 变量 


x 一 一 表示 车 辆 是 否 从 顾客 (或 配送 中 心 ) i 开 往 j( 并 不 一 定 
给 顾客 j 配送 商品 ) ， 如 果 是 ， 其 值 为 1， 否 则 为 0。 

7 一 一 表示 顾客 j 是 否 由 配送 中 心 半 负责 配送 ， 如 果 是 ， 其 值 为 1 
否则 为 0。 

zi 一 一 表示 顾客 j 是 否 由 车 辆 配送， 如 果 是 ， 其 值 为 1， 否 则 为 0。 

(2) 模型 参数 

6 一 一 配送 中 心 、 顾 客 两 类 节点 和 代表 它们 之 间 配 送 线路 的 边 组 成 
的 不 完全 无 向 图 ，C = |S, D, El, XP: S= Inl, =, nml 
表示 配送 中 心 的 节点 集合 ，D = |1, =, n] 表示 顾客 的 节点 集合 ， 
E= |(i, D, i, je 有 =5UD| 表示 配送 中 心 、 顾 客 间 直 接线 路 的 边 的 
集合 。 
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K 一 一 配送 车 辆 集合 {K,,,，…，K,,。| ， 其 中 ，K, 表 示 配 送 中 心 i 
车 辆 的 集合 ，K,nK = 名 ，(izj) ， 即 每 辆 车 仅 隶 属于 一 个 配送 中 心 。 
[一 一 配送 商品 种 类 集合 11,…, Tho 


4, 一 一 配送 中 心 p 的 可 用 车 辆 数 。 

B, 一 一 车 辆 k 的 一 次 性 起 动 费 用 (主要 考虑 车 辆 的 占用 和 损耗 费 
用 ， 略 去 停留 费用 ) 。 

Gi 一 一 车 辆 在 路 线 Ci, j) 单位 路 程 的 运输 费用 (忽略 车 辆 装载 
量 大 小 对 运输 费用 的 影响 ) 。 

qx 一 一 顾客 j 对 商品 1 的 需求 量 。 

d, 一 一 顾客 (或 配送 中 心 ) i, 了 间 的 距离 ， 即 线路 〈i j) 的 
路 程 。 

0 一 一 单个 车 辆 的 装载 量 。 

ui 一 一 商品 /的 重量 (或 体积 ) 系数 。 

VW 一 一 配送 中 心 i 商品 1 的 供应 量 。 

目标 函数 式 (8.1) 由 两 部 分 组 成 ， 第 一 部 分 是 车 辆 的 配送 费用 ， 
第 二 部 分 是 车 辆 启动 的 一 次 性 费用 ， 这 里 是 根据 使 用 车 辆 数 进行 计算 。 
约束 式 (8.2) 保证 从 所 属 配送 中 心 出 发 的 车 辆 返回 到 该 配送 中 心 ; 约 
ER (8.3) 表示 顾客 j 如果 由 车 辆 配送 商品 ， 则 车 辆 k 至 少 访问 顾 
客 j 一 次 ; ARK (8.4) 表示 每 个 顾客 仅 由 一 辆 车 配送 ; SRK 
(8.5) 表示 每 个 配送 中 心 可 用 车 辆 数 限制 ; 约束 式 (8.6) 保证 每 辆 车 
装载 量 不 超过 其 容量 ; HRR (8.7) 表示 每 个 配送 中 心 各 类 配送 商品 
的 供应 量 ; 式 (8.8)、 式 (8.9) 和 式 (8.10) 分 别 为 对 应 的 0-1 决 
策 变量 。 

上 述 模型 为 一 种 改进 的 多 设施 VRP 模型 ， 其 改进 之 处 在 于 结合 了 
B2C 电子 商务 企业 实际 配送 网 络 ， 模 型 中 的 决策 变量 x 可 以 直接 表示 
出 基于 配送 网 络 的 车 辆 路 径 ， 因 而 比 通常 的 多 设施 VRP 模型 更 贴近 现 
实情 况 。 


8.4.2 ”模型 求解 的 捕食 搜索 算法 


下 面 使 用 捕食 搜索 算法 来 对 该 模型 进行 求解 。 

1. 解 的 表达 

采用 顺序 编码 ， 将 无 向 图 中 的 m -1 个 配送 中 心 和 个 顾客 一 起 进 
行 编码 。 例 如 ，3 个 配送 中 心 ，10 个 顾客 ， 则 编码 可 为 : 1-2-3-4- 
0-5-6-7-0-8-9-10, 其 中 0 表示 配送 中 心 ， 上述 编码 表示 配送 
中 心 1 负责 顾客 1， 2, 3, A 的 配送 ， 配 送 中 心 2 负责 顾客 5, 6, 7 的 
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配送 ， 配 送 中 心 3 负责 顾客 8 9, 10 的 配送 。 然 后 对 于 每 个 配送 中 心 
根据 顾客 编码 中 的 顺序 进行 车 辆 的 分 配 ， 这 里 主要 考虑 车 辆 的 容量 约 
东 。 依 此 编码 方案 ,随机 产生 初始 解 。 

2. PREX 

采用 逆转 法 实现 邻 域 的 操作 ， 即 随机 选择 解 的 两 个 位 置 将 它们 之 间 
的 编码 进行 逆转 得 到 当前 解 的 一 个 邻 域 。 

3. 目标 值 的 确定 

目标 值 /(x) 由 编码 解码 得 到 ， 对 于 没有 直接 最 短线 路 的 顾客 间 配 
送 费用 由 FLOYD 算法 求 得 。 另 外 对 超出 配送 中 心 商品 数 和 车 辆 数 的 解 
的 目标 值 给 予 一 定 惩罚 ， 惩 罚 与 其 超 量 成 比例 。 

4. 算法 步骤 

(1) 算法 流程 

第 1 步 : 随机 产生 一 个 初始 解 *， 令 历史 最 好 解 xs。 =x， 限 制 级 别 
level =0， 循 环 次 数 counter =0。 

第 2 步 : 如 果 Level <n+m - 1, 搜索 x 的 邻 域 :次 (s 可 取 问 题 的 规 
BUR n em) ， 并 取 其 最 小 解 x nin, RB 3 步 ， 否 则 结束 。 

第 3 步 : 如 果 f (Enna) Restriction. (level), 4 x 2x, nns WA 
Ba, 否则 转 第 5 步 。 

第 4 步 : 如 果 f (x) «f (x,,). A xus =x, level 20, counter =0, 
重新 计算 限制 ， 然 后 转 第 2 步 ， 否 则 转 第 5 步 。 

第 5 He: 令 counter = counter + 1， 如 果 counter > COUNTER _ MAX 
(最 大 循环 次 数 ) ， 令 level = level +1, counter =0， 然 后 转 第 6 步 ， 否 则 
转 第 2 步 。 

第 6 步 : 如 果 level = [(n +m - 1)/1], & level 2 n & m-1 - 
[Gn em -1)/:]. (通过 限制 的 跳跃 实现 从 局 域 搜索 到 全 局 搜索 的 转换 ， 
[] 表示 取 整数 ) ，: 的 值 视 n+m -1 的 大 小 而 取 值 ， 并 转 第 2 步 ， 否 则 
直接 转 第 2 步 。 

(2) 限制 (Restriction) 的 计算 

每 当 解 得 到 改善 时 〈 即 获得 了 一 个 当前 最 好 的 解 ) ， 执 行 以 下 操作 
得 到 新 的 限制 。 

D 搜索 n+m -2 次 迄今 为 止 发 现 的 最 好 解 的 邻 域 ， 得 到 n+m -2 
个 解 的 值 。 

Q 把 这 n+m -2 个 值 与 发 现 的 最 好 解 的 值 按照 升序 排列 。 

@ 把 排列 后 的 n+m -1 个 值 依次 赋 给 限制 Restriction [0], =, 


Restriction[n +m—2]。 
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8.4.3 仿真 结果 与 比较 分 析 


设 某 B2C 电子 商务 企业 在 某 时 段 由 3 个 配送 中 心 为 17 个 顾客 配送 
3 类 商品 ， 配 送 网 络 如 图 8.4 所 示 。 为 计算 简捷 ， 设 各 配送 中 心 可 用 车 
辆 数 4, =3 辆 ， 最 大 载重 量 Q = 10 +， 车 辆 启动 费用 B, =400 元 ， 单 位 
距离 费用 C, =5 元 ，3 类 商品 的 重量 系数 分 别 为 w, =0.2 吨 / 件 、w, = 
0.4 m/f, w, =0.3 吨 / 件 ， 其 他 相关 参数 见 表 8. 1。 


O- 配送 中 心 节点 O- 顾客 节点 一 一 节点 之 间 的 边 
图 8.4 ”实际 配送 网 络 图 


MSL 顾客 对 3 类 商品 的 需求 量 和 配送 中 心 供应 量 (单位 : 件 ) 
T 


顾客 需求 量 顾客 ARE 顾客 需求 量 

1 (2, 1, 3) 8 (1, 2, 3) 15 ad, 1, 1) 
2 (3,2, 1) 9 (2, 1, 1) 16 (3, 2, 1) 
3 (4, 1, 2) 10 0,2, 1) 17 | 0,1,2) 
4 (1, 1, 1) 11 (2,3,2) | 配送 中 心 商品 量 

5 (3, 3, 2) 12 0,1, 1) 18 (31, 32, 28) 
6 G, 2, 3) 13 (4, 2, 2) 19 (29, 37, 30) 
7 (2, 1, 2) 14 (2, 1, 2) 20 (33, 35, 32) 


捕食 搜索 算法 采用 Java 语言 在 Windows 平台 上 实现 。 其 中 邻 域 搜索 
次 数 s=20，COUNTER_MAX =80，t =6， 惩 罚 系 数 为 500。 求 得 最 优 解 值 
和 车 辆 配送 路 径 见 表 8.2， 可 以 看 出 结果 能 直接 得 到 基于 配送 网 络 的 车 辆 
实际 配送 路 径 ， 而 且 有 些 节点 被 多 次 访问 (如 节点 3、10) ， 该 类 顾客 仅 
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在 第 一 次 被 访问 的 时 候 对 其 进行 配送 服务 CR 8. 2 配送 路 径 中 黑体 节点 
表示 车 辆 配送 的 顾客 和 其 次 序 ) ， 这 和 实际 配送 情况 亦 是 相符 的 。 
表 8.2 最 优 计算 结果 及 最 优 配 送 路 径 


总 费用 
车 辆 和 其 相 配送 
车 辆 启动 | (最 优 目 
应 的 配送 顾 最 优 / 
5 EERE RAV) 费用 /元 | 标 值 ) / 
客 元 E 
元 
18 -8 -10 -13 - 10 
8,10,13,1,2 | g 321-23-18 
配送 中 心 1 18:34:75 530 
3,4,5,6,7,9 
-677-9-18 | 1200 2 085 
meo Pe, | om: | ss 
0? Di | -14-12-11-19 
配送 中 心 3 一 0 


为 了 验证 捕食 搜索 算法 的 有 效 性 ， 将 捕食 搜索 算法 与 基于 类 顺序 交 
又 和 换 位 变异 算 子 的 遗传 算法 〈 编 码 相 同 ， 交 叉 率 为 0.8， 变 异 率 为 
0.05， 种 群 80， 和 迭代 次 数 500) 对 上 述 算 例 各 随机 计算 10 次 ， 得 到 相 
应 的 目标 值 和 计算 时 间 如 表 8. 3 所 示 。 
表 8.3 捕食 搜索 算法 (PS) 与 遗传 算法 (CA) 计算 结果 比较 


目标 值 /元 计算 时 间 / 秒 
计算 次 数 
GA PS GA PS 
1 2380.0 2085.0 0.951 0.441 
2 2265.0 2 085.0 0. 892 0. 460 
3 2 250.0 2 085.0 0.901 0.531 
4 2 440.0 2 085.0 0. 891 0. 631 
5 2290.0 2085.0 0.912 0. 461 
6 2105.0 2085.0 0.821 0.400 
7 2315.0 2085.0 0.831 0.561 
8 2285.0 2 085.0 0. 831 0.491 
9 2345.0 2205.0 0.851 0. 180 
10 2185.0 2085.0 0.811 0.491 
平均 值 2 286.0 2 097.0 0. 869 0. 465 
Lic 285.6 113.8 0. 140 0. 358 
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由 表 8. 3 中 可 以 看 出 ， 捕 食 搜索 算法 求 得 的 目标 值 优 于 遗传 算法 ， 
10 次 计算 中 9 次 得 到 了 最 优 值 (或 近似 最 优 值 ) 2 085. 0 元 ， 而 遗传 算 
法 的 最 好 值 仅 为 2 105. 0 元 ， 计 算 的 平均 值 ， 捕 食 搜索 算法 比 遗 传 算法 
低 8.28% ， 而 且 捕食 搜索 的 计算 标准 差 比 遗 传 算法 小 ， 说 明 捕食 搜索 
算法 求 得 优化 解 的 稳定 性 强 于 遗传 算法 。 从 计算 的 时 间 来 看 ， 捕 食 搜索 
算法 的 计算 效率 高 于 遗传 算法 ,但 是 前 者 的 计算 时 间 没 有 后 者 稳定 ， 可 
以 从 它们 计算 时 间 的 标准 差 上 看 出 这 一 点 ， 这 是 因为 遗传 算法 在 算法 参 
数 设 定 后 计算 时 间 波 动 很 小 (以 最 大 迭代 次 数 为 停止 准则 ) ， 而 捕食 搜 
索 算 法 因为 模仿 动物 捕食 的 内 在 特点 ， 除 了 算法 参数 外 ， 其 初始 解 亦 会 
影响 算法 的 计算 时 间 。 上 述 两 种 算法 在 多 个 算 例 上 进行 了 实验 ， 得 到 了 
相似 的 结论 。 因 而 ， 文 中 设计 的 捕食 搜索 算法 对 模型 的 求解 是 可 行 和 高 
效 的 。 

图 8.5 给 出 了 对 应 网 络 图 中 最 优 解 的 车 辆 配送 路 径 。 


O- matoa O- seta 一 节点 之 间 的 边 


图 8.5 车 辆 最 优 配送 路 径 


问题 与 思考 


1. 流水 车 间 调 度 问题 一 般 可 以 描述 为 个 工件 要 在 m 台 机 器 上 加 工 ， 每 个 工 
FRESH m 道 工序 ， 每 道 工 序 要 求 不 同 的 机 器 。n 个 工件 在 m 台 机 器 上 的 加 工 
顺序 相同 。 工 件 i 在 机 器 ji 上 的 加 工时 间 是 给 定 的 , RA, (i=1,…,n; 
j=1，…，m)。 问 题 的 目标 是 求 n 个 工件 在 每 台 机 器 上 最 优 的 加 工 顺序 ， 使 最 大 流 
程 时 间 到 达 最 小 。 对 该 问题 常 作 如 下 假设 : (1) 每 个 工件 在 机 器 上 的 加 工 顺序 是 
1, 2, =, m; (2) 每 台 机 器 同时 只 能 加 工 一 个 工件 ; (3) 一 个 工件 不 能 同时 在 不 
同 机 器 上 加 工 ; (4) 工序 不 能 预定 ; (5) 工序 的 准备 时 间 与 顺序 无 关 ， 且 包含 在 
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加 工时 间 中 ; (6) 工件 在 每 台 机 器 上 的 加 工 顺 序 相同 ， 且 是 确定 的 。 

试用 捕食 搜索 算法 求解 上 述 问 题 。 要 求 写 明 编 码 方式 、 邻 域 构 成 策略 、 限 制 的 
计算 方式 、 停 止 准则 ， 并 画 出 流程 图 。 

2. 试 比较 捕食 算法 中 通过 限制 变化 实现 的 外 循环 与 模拟 退火 中 通过 温度 变化 
实现 的 外 循环 有 何 异 同 。 

3. 思考 : 能 否 将 捕食 搜索 算法 应 用 于 解决 连续 优化 问题 。 

4. 试 为 捕食 搜索 算法 设计 优化 约束 问题 的 处 理 方法 。 
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第 9 章 动态 进化 算法 


将 进化 算法 应 用 于 动态 环境 的 研究 是 当前 进化 计算 的 研究 热点 之 
一 。 由 于 传统 的 进化 算法 当 其 进化 后 期 会 失去 对 环境 变化 的 适应 能 力 ， 
这 是 进化 算法 在 动态 环境 中 所 面临 的 主要 挑战 。 本 章 对 动态 环境 的 特 
征 、 标 准 的 动态 优化 问题 和 性 能 评估 方法 以 及 怎样 探测 环境 中 的 变化 等 
作 一 介绍 ， 最 后 介绍 一 种 求解 动态 优化 问题 的 原 对 偶 遗 传 算法 及 其 
改进 。 


9.1 Ẹ 言 


很 多 复杂 的 现实 世界 中 的 优化 问题 都 是 动态 的 ， 会 随时 发 生变 化 。 
例如 新 的 Job 不 断 到 达 ， 需 要 立即 加 入 到 当前 调度 中 ; 机 器 可 能 会 发 生 
故障 或 者 降低 加 工 速度 ; 原材料 的 质量 也 会 发 生变 化 以 及 需要 考虑 生产 
限度 的 影响 等 。 在 解决 这 些 动态 优化 问题 的 时 候 ， 需 要 一 类 功能 强大 的 
能 够 处 理 这 些 在 现实 世界 中 普遍 存在 的 不 确定 性 的 启发 式 算法 。 

作为 一 种 鲁 棒 的 优化 方法 ， 进 化 算法 (Evolutionary Algorithms, 
EAs) 经 过 近 几 十 年 的 发 展 一 直 被 广泛 的 应 用 于 各 种 静态 优化 问题 中 ， 
而 且 在 这 个 领域 的 研究 至 今 仍旧 保持 着 快速 的 发 展 。 然 而 ，EAs 也 可 以 
被 认为 特别 适用 于 动态 优化 和 不 确定 性 优化 问题 ， 这 主要 是 由 于 其 基于 
自然 选择 和 生物 进化 的 机 制 实际 上 也 是 一 种 随机 的 动态 过 程 。 

静态 优化 问题 的 特点 是 在 其 优化 计算 过 程 中 ， 问 题 本 身 或 者 外 部 环 
境 并 不 会 发 生 任何 变化 ， 最 优 解 也 始终 保持 不 变 。 然 而 在 动态 环境 中 ， 
问题 的 最 优 解 会 因为 目标 函数 、 环 境 参数 或 者 约束 条 件 的 变化 而 随时 产 
生变 化 。 在 处 理 这 种 动态 情况 时 ， 一 个 最 简单 的 方法 就 是 将 每 一 次 变化 
的 发 生 都 作为 一 个 新 优化 问题 的 开始 ， 然 后 从 头 进行 求解 。 但 是 这 种 简 
单 的 方法 通常 是 不 切实 际 的 ， 其 主要 原因 是 : 

@D 不 重用 过 去 的 信息 而 从 头 求解 问题 会 太 浪费 时 间 。 

@ 环 境 的 变化 可 能 很 难 被 发 现 ， 或 者 至 少 在 一 段 时 间 内 是 未 被 发 
现 的 。 

@ 新 问题 的 解 与 旧 问 题 的 解 不 应 该 相差 太 多 。 

图 每 次 小 变化 后 都 重新 对 问题 进行 求解 是 不 可 能 的 或 者 被 认为 是 不 
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经 济 的 。 

这 就 需要 这 样 一 种 优化 算法 ， 它 不 仅 能 够 持续 地 适应 环境 的 变化 
而 且 能 够 重用 到 过 去 的 信息 。 进 化 算法 因 其 计算 方法 与 自然 界 中 的 适应 
很 类 似 ， 是 一 个 不 断 持续 的 过 程 ， 看 起 来 能 够 作为 解决 动态 优化 问题 的 
不 错 选 择 。 

将 进化 算法 应 用 于 动态 环境 的 研究 最 早 可 以 追溯 到 1966 年 ， 但 是 
直到 20 世纪 80 年 代 中 期 才 成 为 众多 学 者 的 研究 热点 之 一 。 由 于 传统 的 
进化 算法 的 目标 是 使 种 群 逐 渐 收 剑 ， 最 终 获得 一 个 满意 解 ， 这 种 做 法 会 
使 种 群 失去 多 样 性 ， 而 种 群 的 多 样 性 恰恰 是 有 效 地 探索 整个 可 行 空间 的 
必要 条 件 。 因 此 传统 的 进化 算法 当 其 进化 后 期 会 失去 对 环境 变化 的 适应 
能 力 ， 这 是 进化 算法 在 动态 环境 中 所 面临 的 主要 挑战 。 本 章 对 动态 环境 
的 特征 、 标 准 的 动态 优化 问题 和 性 能 评估 方法 以 及 怎样 探测 环境 中 的 变 
化 等 作 一 介绍 ， 最 后 介绍 了 Yang 在 CEC2003 ( Congress on Evolutionary 
Computation 2003) 上 提出 的 一 种 求解 动态 优化 问题 的 原 对 偶 遗 传 算法 
及 其 改进 。 


9.2 动态 环境 的 特征 


一 般 来 说 ， 任 何 时 变 的 问题 都 可 以 认为 是 动态 的 ， 然 而 按照 进化 算 
法 的 观点 ， 并 不 是 所 有 这 样 的 问题 都 是 值得 感 兴趣 的 。 

首先 ， 本 章 所 关注 的 是 那些 函数 适 值 曲线 在 变化 前 后 表现 出 某 种 可 
利用 的 相似 性 的 问题 ， 如 果 该 问题 完全 改变 ， 与 过 去 没有 任何 联系 ， 那 
么 它 应 该 被 认为 是 一 个 完全 独立 的 问题 ， 只 能 从 头 进行 求解 ， 因 为 没有 
任何 信息 能 够 通过 持续 的 适应 而 获得 。 

其 次 ， 即 使 问题 看 上 去 存在 着 某 种 潜在 的 动态 情况 ， 还 需要 看 算法 
是 否 去 处 理 这 些 动态 情况 。 比 如 ， 如 果 EA 的 任务 是 对 一 个 给 定 的 动态 
问题 设计 一 个 模糊 控制 器 ， 那 么 这 个 EA 优化 问题 仍旧 被 认为 是 静态 
的 ， 因 为 这 个 最 优 控制 器 (也 可 以 认为 是 EA 所 发 现 的 最 优 解 ) 并 不 是 
随时 变化 的 。 另 一 方面 ， 同 样 在 这 个 问题 中 如 果 EA 直接 被 用 于 持续 地 
优化 这 些 控制 变量 ， 那 么 它 将 被 认为 是 动态 的 。 

此 外 ， 对 于 噪声 适 值 函 数 的 优化 问题 并 不 属于 本 章 内 容 的 研究 范 
畴 ， 尽 管 这 类 优化 问题 与 动态 优化 问题 很 类 似 ， 然 而 却 完全 不 同 。 因 为 
尽管 存在 某 种 噪声 ， 但 优化 的 目标 仍然 只 是 为 了 寻找 一 个 静态 的 最 优 
解 ， 而 在 动态 环境 中 ， 最 优 解 不 是 唯一 的 ， 是 变化 的 。 

尽管 本 章 仅仅 关注 上 面 所 描述 的 动态 情况 ， 但 并 不 是 所 有 的 动态 环 
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境 都 是 一 样 的 ， 不 同 的 动态 问题 需要 不 同 的 优化 方法 来 解决 。 本 节 接 下 
来 介绍 了 各 种 用 于 区 分 不 同 动态 环境 的 特征 。 

(1) 变化 频率 (Frequency of Change): 环境 多 长 时 间 变 化 一 次 
(从 缓慢 变化 到 频繁 变化 )? 或 者 ,更 重要 的 是 ，EA 在 多 长 时 间 内 去 获 
得 适合 的 解 ? 由 于 算法 运行 时 间 的 比较 依赖 于 硬件 和 具体 的 执行 过 程 ， 
而 且 通 常 在 EA 中 估 值 次 数 是 时 间 的 主要 决定 要 素 ， 因 此 两 次 变化 间 的 
平均 估 值 次 数 通常 作为 估量 变化 频率 的 合适 指标 。 除 非 对 于 计算 时 间 存 
在 着 其 他 的 相关 要 求 ， 否 则 环境 两 次 变化 间 的 实际 时 间 一 般 不 会 作为 衡 
量 频率 的 指标 。 

(2) 变化 强度 (Severity of Change) : 系统 变化 得 有 多 强烈 ? 仅仅 
是 一 个 微小 的 改变 还 是 一 个 全 新 的 情况 ? 这 主要 取决 于 新 旧 最 优 解 基因 
型 之 间 的 距离 ， 当 然 也 可 能 取决 于 其 他 的 一 些 因素 ， 比 如 搜索 空间 的 大 
小 ， 新 最 优 解 是 否 可 以 由 旧 最 优 解 通过 简单 的 疏 坡 获得 ， 或 者 新 最 优 解 
能 否 由 旧 最 优 解 通过 简单 的 变异 获得 。 另 外 ， 在 确定 变化 强度 大 小 的 时 
候 ， 还 可 以 进一步 考虑 搜索 空间 中 每 个 点 质量 上 的 平均 变化 程度 ， 对 于 
高 性 能 区 域 可 能 会 给 予 更 高 的 权重 等 。 

(3) 变化 可 预测 性 (Predictability of Change) : 在 变化 中 是 否 存 在 
某 种 趋势 或 者 模式 ， 还 是 仅仅 是 随机 的 ? 根据 当前 面 对 的 变化 是 否 能 够 
预测 下 一 次 变化 的 趋势 、 时 间或 者 强度 ? 

(4) 循环 长 度 和 准确 性 (Cycle Length/Cycle Accuracy) : 最 优点 是 
否 会 回 到 以 前 的 位 置 或 者 至 少 很 接近 ? 如 果 是 这 样 ， 怎 样 接近 ? 循环 长 
度 就 是 用 来 评估 环境 回 到 相同 状态 或 者 很 相似 状态 时 经 历 的 平均 状态 数 
的 指标 。 如 果 新 状态 并 不 完全 一 样 而 是 有 所 不 同 ， 那 么 新 解 与 以 前 遇 到 
状态 的 解 之 间 的 差异 就 变 得 很 重要 。 循 环 长 度 和 准确 性 可 能 决定 记忆 以 
前 的 解 是 否 是 一 个 有 用 的 策略 。 

对 于 不 同 的 动态 环境 ， 由 于 所 表现 出 的 各 种 动态 特征 可 能 不 尽 相 
同 ， 所 以 一 般 来 说 很 难 对 它们 进行 比较 。 但 至 少 可 以 在 同一 个 问题 中 对 
上 述 各 种 动态 特征 进行 变化 ， 以 便于 检验 这 些 特征 对 一 个 特殊 EA 性 能 
的 影响 。 除 了 上 面 介绍 的 这 些 环境 特征 之 外 ， 在 设计 一 种 应 用 于 动态 环 
境 中 的 EA 时 考虑 如 下 4 个 方面 的 性 质 也 是 很 令 人 感 兴趣 的 。 

(1) 变化 的 可 预知 性 (Visibility of Change): 变化 的 发 生 对 于 系统 
来 说 是 否 是 已 知 的 ， 还 是 需要 去 探测 ? 

(2) 编码 改变 的 必要 性 (Necessity to Change Representation); 个 体 
的 基因 型 是 否 被 变化 所 影响 ， 比 如 说 问题 的 维 数 发 生 了 变化 。 

(3) 变化 的 形式 (Aspect of Change): 变化 是 属于 目标 函数 的 变 
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化 、 环 境 变量 的 变化 还 是 某 些 约束 的 变化 ? 

(4) EA 对 环境 的 影响 : 通常 ，EA 产生 的 解 会 影响 到 环境 ， 比 如 
说 在 调度 问题 中 ,产生 的 解 在 环境 变化 之 前 可 能 已 经 被 部 分 完成 了 ， 这 
就 对 EA 的 将 来 行为 的 选择 产生 限制 ， 或 者 在 并 行进 化 模块 中 ， 一 个 种 
群 的 进化 可 能 会 影响 到 其 他 种 群 的 进化 。 

此 外 ，Weicker 还 提出 了 另 一 类 关于 动态 环境 特征 的 分 类 方法 。 在 
这 种 方法 中 ,环境 可 以 被 划分 为 持续 变化 型 (每 个 周期 都 发 生 相同 的 
变化 ) ， 静 态 型 (不 变化 ) ， 周 期 型 ( 回 到 以 前 的 状态 ) ,一 致 型 ( 整 
个 适 值 曲线 各 个 部 分 的 运动 是 一 致 的 ， 并 非 不 同 部 分 变化 也 不 同 ) 和 
跳跃 型 (最 优 解 可 以 从 适 值 曲线 的 一 个 部 分 或 者 峰 上 随机 的 跳 幅 到 男 
一 部 分 或 者 另 一 个 峰 上 ) 等 。 


9.3 动态 测试 问题 


迄今 为 止 ， 有 超过 20 多 种 动态 优化 问题 被 用 于 检验 各 种 算法 的 性 
能 ， 从 简单 的 数学 函数 到 各 种 调度 问题 乃至 动态 环境 中 各 种 人 工 生命 方 
法 的 应 用 等 。 然 而 大 多 数 问题 都 是 特殊 的 ， 并 不 能 引起 大 多 数 研究 者 的 
共同 兴趣 。 为 了 更 好 地 比较 动态 环境 中 不 同 算法 的 性 能 ， 本 节 接 下 来 将 
介绍 一 组 标准 的 动态 测试 函数 。 这 些 函 数 具 有 如 下 共同 性 质 。 

@D 能 够 变化 9. 2 节 中 定义 的 各 种 环境 变量 。 

@ 能 够 使 用 二 进 制 编码 或 者 实数 编码 。 

@ 能 够 容易 地 描述 函数 曲线 。 

图 易于 分 析 。 

加 计算 效率 高 。 

@@ 能 够 与 现实 问题 相 联 系 。 


9.3.1 动态 位 匹配 问题 


静态 位 匹配 问题 是 一 类 经 常用 于 检验 各 种 算法 性 能 的 测试 函数 ， 通 
常 将 个 体 与 给 定 模板 相 匹配 的 位 数 作为 个 体 的 适 值 。 如 果 模 板 会 随时 变 
化 ， 那 么 这 个 问题 就 变 成 了 动态 位 匹配 问题 (Dynamic Bit-Matching)。 
这 类 问题 相对 容易 定义 、 容 易 分 析 而 且 特别 适合 二 进 制 编码 方式 。 变 化 
的 频率 可 以 直接 利用 评估 次 数 来 设 定 ， 而 强度 可 以 通过 每 次 变化 时 给 定 
模板 的 变化 位 数 所 决定 ， 也 可 以 通过 增加 的 串 长 所 决定 。 对 于 其 他 特征 
比如 说 循环 的 可 预测 性 和 长 度 可 以 通过 直接 重复 一 个 模块 序列 来 实现 。 

这 类 问题 的 缺陷 主要 是 函数 为 单 峰 函 数 ， 有 时 候 一 个 简单 的 疏 坡 算 
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法 可 能 会 比 EA 更 适用 ， 而 且 通 常 被 限制 为 二 进 制 编码 。 
9.3.2 移动 抛物 线 


移动 抛物 线 (Moving Parabola) 问题 是 与 位 匹配 函数 最 为 类 似 的 一 
类 实 编码 的 动态 问题 。 与 动态 位 匹配 问题 一 样 ， 这 类 问题 容易 检验 ， 便 
于 定义 和 分 析 ， 可 以 任意 变动 维 数 ， 而 且 同 样 具 有 单 峰 函 数 的 局 限 。 函 
数 的 变化 可 以 通过 抛物 线 的 移动 来 表现 ， 其 强度 可 以 通过 移动 的 幅度 来 
控制 。 另 外 还 可 以 通过 某 种 特定 的 函数 来 决定 抛物 线 的 运动 方向 、 循 环 
长 度 和 准确 性 。 

Angeline 研究 了 三 种 不 同 动态 模式 〈 线 性、 循环 和 随机 ) 下 的 移动 
抛物 线 函数 。 设 ; 为 一 个 设 定 变化 强度 的 参数 ，n 为 维 数 ，N(0，1) X 
示 一 个 正 态 分 布 的 随机 变量 ， 则 这 种 函数 能 够 通过 式 9. 1 来 计算 。 另 
外 ,+ 被 用 来 记录 环境 变化 的 次 数 ， 环 境 发 生 一 次 变化 〈 也 就 是 每 经 过 
Ae 次 估 值 )，: 就 加 1。 


f(x,t) = ba [x, *&(0]? (9.1) 
线性 变化 
6,(0) =0 Viell,-,nl 
6,(t) =8,(t-1) +s 
随机 变化 
à(0)-0 Viell,-,nl 
&,(1) =5,(t-1) +s- N,(0,1) 
循环 变化 
0,i 为 奇数 
50) = |， 为 偶数 
8,(1) 28,(£-1) +s + c(i,t) ,其 中 ,c(i,t) = 


UP i 为 奇数 
my 
Y 


cos( 


其 中 ，y 表示 环境 能 够 经 历 的 不 同 状态 数 ， 由 此 可 见 y 能 够 决定 环境 的 
变化 周期 。 


9.3.3 时 变 背 包 问题 


时 变 背 包 问 题 (Time - Varying Knapsack Problem) 是 迄今 为 止 最 为 
常用 的 一 类 动态 测试 问题 ， 其 动态 性 主要 体现 在 允许 背包 的 重量 限制 变 
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化 。 这 类 问题 存在 着 一 种 特殊 的 性 质 ， 也 就 是 说 ， 当 重量 限制 降低 时 ， 
旧 解 通常 变 成 了 无 效 解 。 此 时 ， 基 本 上 需要 丢弃 旧 解 ， 促 使 EA 寻找 
新 解 。 

在 大 多 数论 文中 ， 都 是 让 重量 限制 仅仅 在 两 个 值 之 间 变 化 ， 也 就 是 
说 ,环境 仅仅 在 两 种 状态 下 振荡 。 当 然 在 这 种 情况 下 ,记忆 将 会 很 有 
用 。 当 然 也 有 一 些 研究 者 讨论 了 重量 限制 在 三 个 值 之 间 变 化 的 时 变 背 包 
问题 ， 其 变化 可 以 是 随机 的 ， 也 可 以 是 定期 逐步 下 降 的 。 


9.3.4 移动 峰 函 数 


为 了 有 效 地 衔接 复杂 的 不 易于 理解 的 现实 世界 中 的 优化 问题 与 简单 
的 动态 测试 问题 ，Branke 提出 了 一 种 移动 峰 函 数 (Moving Peaks Func- 
tion) ， 该 函数 可 以 描述 为 : 函数 曲线 是 n 维 的 ,， 包含 有 m 个 峰 
(Peaks) 。 环 境 每 发 生 一 次 变化 ， 各 峰 的 高 度 、 宽 度 和 位 置 都 会 发 生 微 
小 的 变动 ， 函 数 的 适 值 定 义 为 所 有 峰 中 的 最 大 值 。 其 表达 式 如 下 : 

(x,t) = max(B(x), max P(x, hi(t), wi(t) p (00) (9.2) 
其 中 ，B(x) 是 一 个 非 时 变 的 “基本 ”曲线 , P 是 一 个 定义 峰 形 的 函 
数 ， 每 一 个 峰 都 具有 自己 的 高 度 (h)、 宽 度 (w) 和 位 置 (p)， 这些 
参数 也 是 时 变 的 。 

每 经 过 Ae 次 估 值 ， 每 个 峰 的 高 度 、 宽 度 和 位 置 都 会 变化 。 每 个 峰 
的 高 度 和 宽度 通过 加 上 一 个 随机 的 高 斯 变量 而 变化 ， 其 位 置 的 移动 是 由 
一 个 长 度 为 * 的 向 量 "而 引起 的 。 这 样 参 数 。( 当然 也 包括 高 度 和 宽度 
变化 的 大 小 ) 可 以 用 来 控制 一 个 变化 的 强度 ，Ae 能 够 决定 环境 变化 的 
频率 。 一 个 新 参数 A 被 用 于 决定 一 个 峰 位 置 的 移动 对 它 前 一 次 移动 的 
依赖 程度 。 如 果 和 =0， 则 每 次 移动 都 是 完全 随机 的 ， 如 果 入 =1， 则 该 
峰 总 是 向 着 一 个 方向 移动 (直到 它 撞 到 参数 空间 的 边界 ， 此 时 它 将 反 
弹 回来 ) 。 

总 之 ， 参 数 * 用 于 控制 一 个 变化 的 强度 ，Ae 能 够 决定 环境 变化 的 
频率 ，A 被 用 于 控制 变化 是 否 展示 一 种 趋势 。 对 于 单 峰 的 一 个 变化 可 由 
下 列 公式 表示 : 


c eN(0,1) (9.3) 

h,(t) =h,(t-1) + height, severity * o (9.4) 
w,(t) 2w,(t - 1) + width severity + o (9.5) 
p(t) =p,(t) tv, (2) (9.6) 


这 里 的 移动 向 量 w 定义 为 一 个 随机 向 量 > 和 前 一 次 移动 向 量 w(:- 1) 的 
线性 组 合 ， 并 且 将 其 长 度 标准 化 为 *， 也 就 是 
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aO nguy )rano-0] (9.7) 


其 中 ， 随 机 向 量 > 的 产生 是 通过 在 每 一 维 上 产生 一 个 随机 数 ， 再 将 其 长 
度 标准 化 为 >。 

这 类 函数 的 复杂 性 可 以 很 容易 通过 增加 空间 的 维 数 和 空间 中 峰 的 数 
量 来 实现 ， 此 外 ， 还 可 以 定义 峰 形 函数 P 的 不 同 表达 形式 和 强度 参数 s 
的 各 种 变化 方法 。 


9.3.5 调度 问题 


现实 世界 中 最 常见 的 一 类 动态 优化 问题 是 调度 问题 ( Scheduling 
Problems) ， 特 别 是 Job Shop 调度 问题 。 

通常 调度 问题 的 动态 性 主要 体现 在 调度 过 程 中 随时 会 有 新 的 工件 到 
达 。 通 常 无 论 什 么 时 候 ， 一 旦 新 工件 到 达 ， 问 题 就 会 依据 当前 的 最 好 解 
发 生变 化 : 所 有 在 新 工件 到 达 前 完成 的 操作 被 固定 下 来 ， 并 从 优化 问题 
中 移出 ， 此 时 的 调度 问题 就 由 所 有 未 完成 的 操作 和 新 工件 加 工 所 需要 的 
操作 所 组 成 。 

很 显然 ， 对 动态 调度 问题 进行 这 样 的 处 理会 给 算法 带 来 两 个 挑战 ， 
第 一 ， 每 次 变化 后 基因 编码 方式 会 发 生变 化 ， 也 就 是 其 长 度 必须 增加 以 
包含 新 到 达 的 工件 。 第 二 ， 在 某 一 特定 时 期 内 的 最 好 解 将 会 影响 未 来 的 
适 值 曲 线 (因为 每 一 次 固定 下 来 的 操作 依赖 于 当前 的 最 好 解 )， 这 会 给 
算法 间 的 比较 带 来 更 多 的 难度 。 

尽管 变化 频率 可 以 通过 一 种 直接 的 方式 设 定 ， 然 而 变化 的 强度 却 很 
难 控制 ， 与 大 多 数 现实 问题 一 样 ， 进 一 步 的 分 析 更 是 难以 进行 。 

Fang 等 人 提出 了 另 一 种 动态 的 Job Shop 调度 问题 ， 调 度 的 工件 数 
量 被 固定 ， 而 工件 的 加 工时 间 和 交 货 期 会 发 生变 化 。 虽 然 这 种 调度 问题 
的 研究 不 多 ， 但 是 可 以 作为 通 向 实际 调度 问题 的 一 个 中 间 阶 段 。 

不 幸 的 是 ， 到 目前 为 止 看 起 来 还 没有 任何 形式 的 可 公开 使 用 的 动态 
JSSP 问题 的 标准 测试 数据 ， 大 多 数 调度 问题 的 规模 都 相对 较 小 。 
Bierwirth 和 Mattfeld 在 他 们 的 研究 中 指出 动态 调度 问题 的 规模 应 该 足够 
大 ， 以 避免 在 仿真 的 开始 或 结束 阶段 产生 某 些 无 意识 的 影响 。 

为 了 构造 一 个 简单 却 易于 分 析 和 进行 参数 调节 的 调度 问题 ， 
Mattfeld Engelmann 和 Branke 设计 了 一 个 带 有 交 货 期 和 安装 时 间 的 单 
机 调度 问题 。 因 为 这 是 一 个 单机 问题 ， 所 以 优化 目标 是 获得 工件 在 该 机 
器 上 的 最 优 加 工序 列 ， 而 任何 一 个 序列 都 是 可 行 的 。 此 问题 的 动态 性 表 
现 为 两 种 模式 : 可 变 处 理 时 间 (Variable Processing Times) 模式 和 滚动 
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时 间 窗 (Rolling Time Horizon) 模式 。 前 者 是 指 工件 被 固定 ， 而 处 理 时 
间 和 交 货 期 会 随时 发 生变 化 。 在 滚动 时 间 窗 模式 中 ， 环 境 每 次 变化 时 就 
会 有 个 新 工件 一 批 到 达 ， 此 时 在 当前 的 最 优 解 中 所 有 在 新 工件 到 达 前 
完成 的 工件 要 被 固定 下 来 ， 并 从 优化 问题 中 移出 。 于 是 可 以 利用 每 次 变 
化 时 到 达 的 新 工件 数量 ”来 控制 变化 强度 ， 而 变化 间 估 值 次 数 用 以 决定 
变化 频率 。 


9.3.6 Wiki 


Branke 在 检验 记忆 (Memory) 对 EA 性 能 影响 的 实验 中 设计 了 一 

种 振荡 环境 : 在 n 维 空间 中 ， 存 在 1 条 曲线 (通常 1=2)， 每 条 曲线 包 

含 m 个 随机 选择 的 峰 ( 蜂 函数 的 定义 见 9. 3.4 节 中 的 介绍 ) ， 每 条 曲线 

按照 一 个 Cosine 函数 振荡 。 这 个 振荡 峰 函 数 (Oscillating Peaks Func- 
tion) 的 函数 表达 式 为 

fi) =w(t)f.(0) (9.8) 


w(t) = 0.5 cos 2 rm az) 40.5,i21,,l (9.9) 


其 中 ，steps 表示 一 次 循环 中 的 中 间 步 数 。 由 此 看 来 ， 函 数 实际 上 是 在 T 
条 曲线 之 间 振荡 。 


9.4 性 能 评估 方法 


在 动态 优化 问题 中 通常 并 不 存在 唯一 的 非 时 变 的 最 优 解 ， 因 此 算法 
的 目标 并 不 是 为 了 找到 某 个 极 值 点 ， 而 是 尽 可 能 紧密 地 追踪 极 值 点 在 可 
行 空 间 内 的 运动 轨迹 。 为 了 比较 不 同 算法 之 间 性 能 的 优 劣 ， 在 当前 的 文 
献 中 研究 者 们 常常 使 用 一 些 能 够 显示 算法 聚集 程度 (也 就 是 指 每 一 代 
种 群 的 最 优 适 值 和 平均 适 值 ) 的 性 能 评估 方法 。 

从 目前 的 研究 来 看 ， 下 面 这 种 数字 评估 方法 可 以 作为 用 来 比较 动态 
环境 中 算法 性 能 的 不 错 选择 。 

ÆR (Online) 性 能 和 离线 (Offline》 性 能 最 初 是 由 DeJong 提出 的 
用 于 检验 静态 问题 的 性 能 评估 方法 ， 但 很 多 研究 者 也 将 它们 用 在 动态 优 
化 问题 中 。 设 : e 是 第 :次 估 值 ，7 是 所 考虑 的 估 值 次 数 。 那 么 

(1) 在 线性 能 * 能 够 通过 计算 整个 循环 中 所 有 适 值 的 平均 值 获得 ， 


LER See 由 此 可 见 ， 在 线性 能 能 够 体现 实际 问题 中 每 一 次 估 值 


Fi 


都 需要 检验 的 要 求 。 
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(2) 离线 性 能 "能够 通过 计算 黑 积 的 当前 平均 的 最 优 值 获得 ， 即 
x ap Del JUR melee. 可见 ， 离 线性 能 是 出 于 考 


虑 在 实际 优化 问题 中 仅仅 需要 考虑 所 获得 的 最 优 和解。 然而 在 非 静态 环境 
中 ， 这 种 评估 方法 存在 一 定 的 问题 ， 因 为 这 里 需要 保证 e 是 在 当前 环 
境 中 ， 算 法 到 目前 所 能 获得 的 最 好 解 ， 而 当 环境 发 生 一 次 变化 后 ， 所 有 
个 体 需要 被 重新 估 值 。 因 此 ， 在 计算 动态 环境 中 的 离线 性 能 时 所 考虑 的 


个 体 应 该 是 环境 上 一 次 变化 后 经 过 重新 估 值 的 个 体 ， 即 x = 十 e 


"Puer m maxle,,e, vos el, 7 表示 环境 最 后 一 次 变化 时 的 估 值 次 数 。 
当然 在 使 用 离线 性 能 时 需要 算法 在 其 运行 过 程 中 能 够 探测 到 环境 的 
变化 。 

如 果实 际 的 最 优 解 可 以 随时 获知 ， 那 么 平均 误差 也 可 以 作为 一 种 性 
能 评估 方法 ， 当 然 也 有 在 线 和 离线 两 种 模式 ， 也 要 考虑 环境 变化 时 最 优 
解 和 个 体 适 值 的 变化 情况 。 如 果 要 防止 出 现 较 大 的 误差 ， 则 可 以 使 用 均 
方差 指标 。 有 时 还 可 以 使 用 相对 误差 (用 最 优 解 减 去 当前 的 最 好 解 ) 
来 代替 绝对 误差 来 评估 算法 的 性 能 。 

在 很 多 应 用 问题 中 ， 实 际 上 关注 的 仅仅 是 当前 所 能 获得 的 最 好 解 ， 
那么 此 时 每 种 环境 状态 下 所 能 获得 的 最 好 解 的 平均 值 也 可 以 作为 一 种 合 
适 的 评估 指标 。 当 算法 不 能 连续 地 适应 一 个 变化 的 环境 ， 但 还 被 要 求 在 
一 定 的 预定 时 间 内 获得 一 个 满意 解 时 ， 这 种 性 能 的 评估 方法 无 疑 是 适 
用 的 。 

从 目前 来 看 ， 离 线性 能 和 离线 误差 看 上 去 是 最 合理 的 评估 指标 。 这 
是 由 于 随 着 算法 的 运行 ， 这 些 累 积 的 方法 会 使 越 来 越 多 的 估 值 进行 平 
均 。 这 样 算法 的 性 能 曲线 会 变 得 越 来 越 平滑 ， 能 够 更 准确 地 反映 算法 的 
长 期 性 能 。 由 于 算法 的 追踪 能 力 是 动态 优化 问题 中 最 令 人 感 兴趣 的 性 
质 ， 所 以 在 评估 算法 性 能 的 时 候 ， 有 时 候 往往 会 忽略 算法 运行 的 最 初 几 
R (在 此 过 程 中 ， 算 法 在 寻找 第 一 个 最 优 解 ， 可 见 这 其 实 是 一 个 静态 
阶段 ) ， 而 仅仅 评估 算法 经 过 初始 启动 阶段 之 后 的 性 能 。 如 果 算 法 在 初 
始 启动 阶段 的 性 能 也 是 重要 的 ， 通 常 也 将 初始 启动 阶段 的 性 能 和 长 期 运 
算 性 能 分 别 进行 比较 。 


9.5 ”探测 环境 中 的 变化 


为 了 让 算法 能 够 直接 对 环境 的 变化 做 出 反应 ， 它 首先 要 能 够 探测 所 
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发 生 的 变化 。 在 很 多 研究 中 ， 变 化 对 于 系统 来 说 是 已 知 的 ， 比 如 动态 调 
度 问 题 中 要 加 入 到 调度 序列 中 的 已 到 达 的 新 工件 是 已 知 的 。 然 而 ， 在 另 
外 一 些 情况 下 ， 例 如 原材料 的 质量 可 能 随时 发 生变 化 ,环境 的 变化 是 需 
要 系统 探测 的 。 

如 果 能 够 假设 环境 的 变化 或 多 或 少 会 引起 当前 解 质量 的 下 降 ， 那 么 
将 监测 整个 种 群 性 能 或 者 其 累积 平均 最 优 解 的 退化 作为 环境 变化 的 探测 
器 是 一 种 最 常用 的 方法 。 在 一 些 研究 中 还 发 现 ， 适 值 也 可 以 被 用 来 决定 
什么 时 候 发 现 了 新 的 最 优 解 ， 也 就 是 说 ， 当 旧 的 最 优 解 被 发 现时 也 就 决 
定 了 新 的 最 优 解 至 少 在 质量 上 要 不 弱 于 它 。 

Branke 采用 了 另 一 种 略 有 不 同 的 探测 环境 变化 的 方法 ， 在 算法 运 
行 的 每 一 代 ， 若 干 个 个 体 都 要 被 重新 估 值 。 如 果 其 中 至 少 有 一 个 个 体 的 
适 值 发 生 了 变化 ， 那 么 就 可 以 认为 环境 也 发 生 了 变化 。 

Fogarty 等 人 简要 介绍 了 利用 计算 一 个 EA 性 能 的 确认 模块 来 探测 环 
境 变 化 的 方法 ， 当 某 个 限制 值 被 超过 时 ，EA 将 被 重启 。 也 就 是 说 ， 环 
境 变 化 很 大 以 至 于 算法 的 性 能 已 经 不 再 令 人 满意 了 。 然 而 遗憾 的 是 ， 作 
者 并 没有 指出 这 个 确认 模块 是 怎样 工作 的 。 

还 有 一 些 探测 环境 变化 的 方法 ， 比 如 通过 建立 当前 环境 的 模型 ， 并 
持续 地 监视 这 个 模型 是 否 与 实际 环境 保持 一 致 。 如 果 利 用 模型 预测 的 反 
应 与 从 实际 环境 中 获得 的 反应 相差 很 大 ， 那 么 就 可 以 认为 环境 已 经 发 生 
了 变化 。 此 时 模型 需要 被 更 新 ，EA 要 被 重启 。 


9.6 原 对 偶 遗 传 算法 


近 些 年 来 ， 越 来 越 多 的 研究 者 开始 关注 进化 算法 在 动态 优化 问题 中 
的 应 用 ， 提 出 了 很 多 改进 策略 并 取得 了 很 好 的 效果 。 本 节 接 下 来 对 
Yang 在 Proceeding of the 2003 Congress on Evolutionary Computation 提出 
的 原 对 偶 遗 传 算法 (Primal - Dual Genetic Algorithm, PDGA) 进行 重点 
介绍 ， 而 对 其 他 的 适用 于 动态 环境 的 进化 算法 仅 作 简单 的 介绍 ， 如 果 读 
者 对 此 感 兴趣 的 话 ， 请 参考 相关 的 综述 性 文献 。 


9.6.1 原 对 偶 映 射 


通常 动态 环境 需要 CA 保持 足够 的 多 样 性 才能 持续 地 适应 一 个 变化 
的 适 值 曲线 。 为 了 改善 GA 在 动态 环境 中 的 性 能 ， 一 些 研究 者 将 自然 界 
中 普遍 存在 的 补体 和 显 性 机 制 引入 到 算法 中 。 在 自然 界 和 生物 学 中 ， 互 
补 现象 是 普遍 存在 的 ， 例 如 


9.6 原 对 侦 遗 传 算法 289 


自然 界 
白天 心 黑夜 
热带 全 极地 
生物 表现 型 
AB thek tt 
i Fo Ra 
生物 基因 型 


DNA 的 双 链 结构 (AST, Gec) 

在 双 匀 链 的 染色 体 中 ， 由 于 显 性 机 制 的 作用 ， 使 得 染色 体 仅 表达 显 
性 基因 的 性 状 ， 压 制 隐 性 基因 的 性 状 。 

受 这 种 补体 和 显 性 机 制 的 启发 ，Yang 提出 了 用 于 动态 0 -1 优化 问 
题 的 PDGA 算法 。 在 PDGA 中 ， 每 个 染色 体 都 在 给 定 距离 空间 (比如 
Hamming 距离 空间 ) 内 定义 了 一 个 与 之 具有 最 大 距离 的 对 偶 染 色 体 。 
在 PDGA 运行 过 程 中 ， 在 和 迭代 进入 下 一 代 之 前 总 是 选择 一 部 分 低 适 值 的 
个 体 进行 对 偶 运算 ， 并 且 给 那些 优秀 的 对 偶 染 色 体 提供 传递 到 下 一 代 的 
机 会 。 这 种 在 原 对偶 染 色 体 之 间 的 原 对 偶 映 射 (Primal - Dual Mapping, 
PDM) 能 够 改善 PDGA 在 搜索 空间 里 的 探索 能 力 ， 使 搜索 更 为 有 效率 。 


9.6.2 相关 研究 综述 


在 传统 EA 的 运行 过 程 中 ， 随 着 迭代 的 进行 ， 所 有 个 体会 逐渐 收敛 
于 某 个 局 优点 (或 最 优点 ) 附近 ， 这 就 使 得 种 群 失去 其 多 样 性 ， 难 以 
对 环境 的 变化 做 出 快速 的 反应 。 这 就 是 EA 在 解决 动态 优化 问题 时 所 面 
临 的 主要 挑战 ， 近 些 年 来 ， 一 些 学 者 开始 采用 一 些 基于 补体 机 制 的 方法 
来 改善 EA 在 动态 环境 中 的 性 能 ， 接 下 来 本 节 将 对 这 些 方法 进行 简单 的 
介绍 。 

最 能 体现 基因 补体 机 制 的 GA 方法 就 是 多 倍 体 的 方法 。Goldberg 和 
Smith 提出 了 基于 二 倍 体 和 基因 显 性 机 制 (Dominance) 的 CA， 由 于 无 
法 预先 确定 特定 基因 是 否 为 显 性 ， 他 们 采用 了 三 等 位 基因 的 方案 ， 也 就 
是 基因 位 值 随机 地 选取 为 “0"”,“ 隐 性 1” 或 者 “ 显 性 1”， 在 动态 背包 
问题 的 应 用 中 ， 该 方法 比 起 简单 GA 来 说 表现 出 更 好 的 性 能 。 

但 是 Goldberg 和 Smith 的 三 等 位 基因 方法 受到 了 Ng 和 Wong 的 质 
疑 ， 他 们 认为 三 等 位 基因 方法 的 结论 是 有 异议 的 ， 所 取得 的 结论 之 所 以 
比 单 倍 体 染色 体 的 GA 好 ， 主 要 是 由 于 三 等 位 基因 CA 的 收敛 速度 较 
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慢 ， 从 而 适应 于 论文 中 所 使 用 的 频繁 变化 的 环境 ， 而 在 其 他 的 动态 环境 
中 ， 单 倍 体 GA 可 能 会 取得 比 三 等 位 基因 GA 更 好 的 结论 。Ng fl Wong 
提出 了 一 种 新 的 四 等 位 基因 的 二 倍 体 方法 ,为 了 更 快 地 适应 环境 的 变 
化 ， 他 们 采用 了 一 种 基因 显 性 变化 机 制 ， 当 一 个 个 体 的 适 值 减少 超过 
20% 时 ， 所 有 的 等 位 基因 位 值 都 发 生 转 换 〈 即 从 显 性 转化 成 隐 人 性 ， 反 
之 亦 然 ) 。 他 们 在 实验 中 发 现 这 种 二 倍 体 方法 要 优 于 单 倍 体 和 三 等 位 基 
因 的 二 倍 体 方法 。 

Hadad 和 Eick 还 提出 了 一 种 多 倍 体 的 方法 ， 他 们 将 一 个 显 性 变量 
作为 个 体 的 一 部 分 ， 在 动态 背包 问题 中 ， 这 种 方法 能 够 获得 与 二 倍 体 方 
法 一 样 好 的 性 能 ， 而 且 发 现 多 倍 体 的 方法 更 适用 于 变化 频率 较 高 的 环 
境 。Ryan 使 用 了 一 种 附加 多 倍 体 ， 附 加 的 基因 用 于 决定 个 体 表现 型 的 
某 个 特性 ， 当 一 个 特定 的 阔 值 被 超过 时 ， 个 体 表现 型 的 特性 值 变 成 
1， 反 之 为 0。 在 后 来 的 研究 中 ， 他 对 上 述 方法 作 了 进一步 的 改进 ， 当 
阔 值 被 超过 时 ， 个 体 表现 型 的 特征 为 1; 当 这 个 值 低 于 阔 值 b, 时 ， 
表现 型 的 特征 变 为 0; 如 果 介 于 b, 和 b, 之 间 ， 则 表现 型 的 特性 随机 选 
取 。 结 果 发 现在 某 些 动态 问题 中 ， 这 种 方法 要 优 于 Ng 和 Wong 的 方法 。 

Lewis 等 人 在 比较 上 述 几 种 多 售 体 方法 在 振荡 背包 问题 中 的 应 用 时 
发 现 仅 采用 简单 的 显 性 机 制 并 不 能 保证 能 够 有 效 地 追踪 到 最 优点 ， 而 采 
用 了 基因 显 性 变化 机 制 的 二 倍 体 方法 ， 则 取得 了 很 好 的 效果 。 从 目前 的 
研究 来 看 ， 多 倍 体 的 方法 在 周期 性 变化 环境 中 表现 出 很 好 的 性 能 ， 这 主 
要 是 因为 多 倍 体 编码 能 够 帮助 EA 记 住 环境 所 经 历 的 变化 状态 ， 使 得 
EA 能 够 迅速 地 对 环境 的 周期 振荡 做 出 反应 。 但 是 在 非 周 期 性 变化 环境 
或 者 经 历 的 状态 数 较 多 的 周期 性 变化 环境 中 是 否 能 够 有 效应 用 ， 依 然 存 
在 着 疑问 。 

Collard 等 人 提出 的 对 偶 GA (Dual Genetic Algorithm, DGA) 也 是 
一 种 展现 补体 机 制 的 方法 。 在 DGA 中 ,个 体 的 基因 型 中 被 加 入 了 一 位 
元 基因 (位 串 的 第 一 位 ) ， 当 元 基因 的 位 值 为 0 时 ， 没 有 什么 影响 ， 如 
果 位 值 为 1， 则 后 面 所 有 的 位 值 将 取 反 。 这 样 搜索 空间 中 每 个 点 就 有 了 
两 种 互补 的 表现 形式 ， 比 如 说 ,个 体 [0011] 和 [1100] 表示 的 都 是 
空间 中 的 同一 个 点 ， 具 有 相同 的 表现 型 。 在 DGA 中 ,元 基因 的 使 用 会 
带 来 两 个 好 处 。 首 先 ， 元 基因 的 一 个 简单 变异 就 会 使 个 体 完成 其 对 补体 
的 跳 瞩 ， 也 就 是 说 ， 能 够 碱 小 了 搜索 空间 中 两 点 间 的 最 大 Hamming E 
离 。 其 次 ， 即 便当 GA 收敛 于 一 个 表现 型 时 ,个 体 的 每 一 位 基因 都 可 能 
ARK. Bult, DCA 能 够 不 依靠 变异 而 是 依靠 “反射 操作 ”就 
能 使 染色 体 发 生 很 大 变化 ， 而 对 偶 染 色 体 之 间 的 交叉 运算 可 以 看 做 是 发 
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生 了 直接 变异 ， 因 为 两 个 染色 体 之 间 每 一 位 都 不 相同 。 
9.6.3 PDGA 算法 的 框架 结构 


为 了 描述 方便 ， 首 先 介绍 PDGA 算法 中 的 一 些 相关 定义 。 

初始 染色 体 (Primal Chromosome): 是 指 当 前 种 群 中 直接 记录 的 染 
色 体 。 

对 偶 染 色 体 (Dual Chromosome): 是 指 在 给 定 距离 空间 中 ， 与 原 染 
色 体 距离 最 远 的 染色 体 。 记 * = dual (x*) ， 其 中 *，x' 分 别 表示 原 染 色 
体 和 对 偶 染 色 体 ，dual (+) 表示 原 对 偶 映 射 (PDM) 函数 。 

本 节 主 要 讨论 二 进 制 编码 的 SA， 通常 使 用 Hamming 距离 作为 PD 
映射 函数 。 此 时 ， 两 个 染色 体 之 间 的 Hamming 距离 指 的 是 这 两 个 染色 
体 对 应 基因 位 点 的 值 的 不 同 个 数 。 因 此 ， 在 二 进 制 空 间 中 ， 一 对 染色 体 
可 以 称 为 一 对 原 对 偶 染 色 体 ， 如 果 他 们 之 间 具 有 最 大 的 Hamming 距离 ， 


也 就 是 说 ， 若 给 定 一 个 长 度 为 上 的 染色 体 *= Im, xm, ocn xl el= 
10，11*， 则 它 的 对 偶 染 色 体 《 如 图 9.1 BUR) Wx’ =dual (x) =*= 
Ix, X, oos X ed, HP xsl- (i=l, 2, =, L)o 

原 染色 体 : 9 1 9 1) 1 0 

poms: 0| f f Fo 4 4 

WARE: 1 0 1 9 0 1 


图 9.1 一 个 PD 映射 的 例子 

优势 染色 体 (Superior Chromosome) : 是 指 一 对 原 对 偶 染 色 体 中 适 
值 较 大 的 染色 体 ， 如 果 它 们 的 适 值 不 相等 的 话 ; 而 适 值 较 小 的 染色 体 则 
被 称 为 劣势 染色 体 (Inferior Chromosome) 。 如 果 获 得 的 对 偶 染色 体 是 优 
势 染 色 体 ， 则 一 个 PD 映射 能 够 被 称 为 是 有 效 的 ; 否则 这 个 PD 映射 就 
是 一 个 无 效 的 映射 。PDCA 的 基本 思想 就 是 希望 通过 有 效 的 PD 映射 来 
改善 GA 的 性 能 。 

根据 上 面 的 定义 ，PDGA 算法 的 框架 如 图 9.2 Pim, HN, Po 
P. 分 别 表示 种 群 大 小 ， 交 叉 率 和 变异 率 ，f(*) 表示 个 体 x NEBR. 
在 PDGA 中 ， 当 产生 一 个 中 间 种 群 P(:) 并 完成 常规 的 遗传 运算 (交叉 
变异 运算 ) ZE, MAPU 中 选择 一 定数 量 D(:) 的 个 体 ， 并 计算 它 
们 的 对 偶 染 色 体 。 对 于 任何 xseD(+) ， 如 果 它 的 对 偶 染色 体 *' 适 值 更 
大 ， 则 >* 将 被 HR; 否则 x 就 保留 下 来 。 也 就 是 说 ， 只 有 有 效 的 
PD 映射 才能 够 使 好 的 对 偶 染 色 体 有 机 会 传递 到 下 一 代 种 群 中 。 
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PDGA 的 计算 过 程 


开始 

参数 设置 (N, P., P’); 

令 迭 代 指标 :=0; 

初始 化 种 群 P(O); 

对 PCO) 中 的 所 有 染色 体 进行 估 值 ; 

从 P(0) 中 选择 一 部 分 个 体 构成 DCO) ; 

for D(0) 中 的 每 一 个 个 体 x do 
计算 x 的 对 侦 染 色 体 r’, HR *' 进 行 估 值 ; 7/2’ = dual(x) 
if f(x') >f(x), then 用 x' 蔡 代 P(0) (PES x; 

end for; 

repeat 

产生 中 间 种 群 P(t); 

对 P(4) 进 行 正常 的 遗传 运算 〈 交 叉 、 变 异 等 ); 

从 P(t) 中 选择 一 部 分 个 体 构成 D(0) 5 

for D(+) 中 的 每 一 个 个 体 * do 
计算 * 的 对 偶 当 色 体 s, HERE x' 进 行 估 值 ; //x'=dual(*) 
if f(x’) >Kx) ，then 用 xz" 车 代 PCO) PAY x; 

end for; 

t=t+1; 

until 终止 条 件 被 满足 // 例 如 ，: > tas 

结束 


图 9.2 PDGA 算法 的 简单 流程 
9.6.4 PDGA 中 相关 参数 的 讨论 


1. 怎样 构造 PDM & D(t) 

从 上 面 的 讨论 可 以 清楚 地 看 到 ， 从 一 个 中 间 种 群 P(t) 中 选择 原 染 色 
体 组 成 一 个 PD 映射 集 D(t) 的 目标 应 该 是 最 大 化 有 效 的 原 对 偶 上 映射 ， 也 
就 是 说 ， 应 该 尽 可 能 能 从 种 群 中 选择 劣势 的 原 染 色 体 。 可 见 ， 选 择 方案 
的 确定 主要 涉及 P(t) 中 什么 样 的 原 染色 体 应 该 被 选择 ， 数 量 是 多 少 。 

由 于 仅仅 是 有 效 的 原 对 偶 映 射 才能 起 作用 ， 显 然 对 低 适 值 的 染色 体 
进行 的 原 对偶 映 射 更 有 可 能 是 有 效 的 。 因 此 ， 总 是 从 PUO) 中 选择 适 值 
最 小 的 个 体 来 构成 D(1) 。 设 ns(t) 为 第 : 代 从 P(t) 中 选择 原 染 色 体 组 
成 PDM $ D(t) 的 大 小 , 即 ni(:) = |D(9 |。 在 算法 运行 的 每 一 代 ， 
总 是 从 P(t) 选择 ns(t) 个 最 小 的 原 染 色 体 用 于 对 偶 运 算 。 现 在 剩 下 来 
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的 问题 是 怎样 确定 ny (t) 的 值 。 
在 文献 中 作者 提出 了 一 种 适应 性 的 方法 来 确定 ns(:) WAKA, UE 


n,(t-1) 是 第 :-1 RAR PD 映射 的 实际 数量 ， 则 nC) 计算 如 下 : 
n,(t-1) 
ATT 
sign(t) = ERE =6 (9.10) 
n (t-1) 
TV 
na(t) = [ex NT, ec (9.11) 
cai ennai 


ER (9.10) 中 , 8e (0, 1) 用 来 表示 n (0) 变化 的 趋势 : MK, W 
小 或 者 保持 不 变 ; ER (9.11) 中 , ae (0, 1) 和 Be(0， 1) 分 别 用 
于 控制 n,(t) 的 初始 大 小 和 增 大 或 减 小 的 速度 ，nw，ns e (0, N) 是 
预先 设 定 的 从 PC) 中 选 出 的 用 于 进行 PD 运算 的 原 染色 体 最 大 和 最 小 
数量 。 在 这 种 适应 性 的 原 染色 体 选择 方案 中 ,ns(t) 能 够 根据 上 一 代 


原 对 偶 吴 射 中 的 有 效 映射 所 占 的 比率 (人 这 是 否 超过 某 一 给 定 的 六 


值 5 进行 适应 性 的 调整 。 如 果 中 


BUTE <a, m(D BUS 若 相 等 ， 则 nO) 保持 不 变 。 这 种 选 
择 方法 会 给 PDGA 带 来 更 强 的 适应 性 ， 特 别 是 在 动态 环境 中 ，n,(1) 
会 随 着 时 间 的 变化 而 变化 。 

2. 一 种 适应 性 的 PD RAAT 

上 面 讨论 了 在 PDCA 中 如 何 适应 性 的 调整 PD BRA DCO) 的 大 小 。 
值得 注意 的 是 ， 在 Yang 的 PDGA rb, PD 映射 函数 被 设计 为 Hamming 
空间 的 最 大 距离 ， 也 就 是 说 ， 在 对 一 个 原 染色 体 进行 PD 运算 时 ， 它 的 
每 一 位 基因 都 要 参加 运算 。 然 而 很 多 时 候 ， 这 种 强烈 的 映射 并 不 会 改善 
算法 的 性 能 。 比 如 在 后 期 迁 代 过 程 中 ， 种 群 中 几乎 所 有 的 原 染色 体 都 分 
布 在 高 性 能 ( 适 值 较 大 ) 的 区 域 ， 此 时 它们 的 对 偶 染 色 体 往往 适 值 较 
低 ， 这 样 几乎 所 有 的 PD 映射 都 是 无 效 的 。 而 无 效 的 PD 映射 除了 浪费 
计算 资源 之 外 ， 既 不 能 帮助 种 群 获得 更 好 的 解 ， 也 不 会 丰富 种 群 的 多 样 
性 〈 后 者 对 于 解决 动态 优化 问题 更 为 重要 ) 。 另 外 ， 当 环境 发 生 一 定 的 
变化 ， 但 变化 强度 较 小 时 ， 这 种 过 于 “强烈 ”的 PD 映射 也 无 法 明显 改 


>6， 则 ns(t) 将 增 大 ; 如果 
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善 算法 的 性 能 。 因 此 ， 为 了 改善 PD 映射 的 有 效 性 ， 下 面 讨论 一 种 新 的 
适应 性 的 基于 统计 的 PD 映射 方法 (Statistic - Based Primal-Dual 
Mapping, SPDM) ， 考 虑 并 不 是 让 染色 体 的 每 一 位 都 同时 参加 运算 ， 而 
是 根据 当前 种 群 的 某 种 统计 信息 来 决定 它 是 否 进 行 运算 。 

在 这 种 基于 统计 的 PD 映射 方法 中 ， 各 基因 位 点 的 参与 运算 的 概率 
是 一 个 重要 的 变量 ， 这 里 提出 一 种 利用 染色 体 各 基因 位 点 取 值 的 统计 信 
息 来 计算 该 位 点 参加 PD 运算 概率 的 方法 。 设 p(i) 为 基因 位 点 i 参加 
PD 运算 的 概率 ，i=1，2，…，7; f, 为 在 种 群 中 符号 : 在 基因 位 点 i 上 
的 出 现 频率 ，* 为 基因 位 点 的 编码 取 值 。 对 于 0 -1 编码 空间 ， 存 在 f, + 
fa =l, OSfus /<1。 包 :能够 被 看 做 基因 位 点 i 上 位 值 趋向 于 “1” 的 
程度 ， 如 果 所 有 fi 都 趋 近 于 1 或 者 0， 那 么 整个 种 群 就 趋 于 收敛 。 可 见 
由 所 有 /构成 的 一 维 向 量 fuas fus ons ful 能 够 在 基因 层 上 反映 这 
个 种 群 的 收敛 程度 。 如 图 9.3 Ha, pCi) 可 以 计算 如 下 : 


(e 0.5 -fus fi<0.5 (9:32 
á 70.5, fu >0.5 ` 

1 
a 09 
E 08 
FIT 
了 06 
ROS 
* 0.4 
a o3 
02 


0.1 
00-9192 9303 05 06 07 08 03 1 
基因 位 点 取 值 为 1 的 频率 2 
图 9.3 基因 位 点 参加 PD 映射 的 概率 


很 显然 ， 对 于 二 进 制 编码 空间 来 说 ,利用 来 计算 p(i) 也 会 取得 
一 样 的 效果 。 由 图 9.3 中 能 够 看 出 当 /; =0.5 时 pCi) =0 取得 最 小 值 ; 
当 f,=1 或 0 时 p(i) =1 最 大 ， 也 就 是 说 在 整个 种 群 中 某 个 基因 位 点 的 
值 越 集中 ， 该 位 点 进行 PD 运算 的 概率 越 大 。 这 主要 是 考虑 到 一 个 发 散 
的 种 群 能 够 更 容易 适应 环境 的 变化 。 根 据 这 种 基于 统计 的 映射 方法 ， 算 
法 能 够 根据 当前 种 群 收敛 程度 对 PD 运算 进行 适应 性 调整 。 当 P(1) = 
p(2) =… =p(L) =1 时 ， 就 是 最 初 的 PD 映射 方法 。 图 9. 4 给 出 了 一 个 
对 图 中 的 染色 体 使 用 SPDM 方法 的 例子 。 
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1 的 频率 ， 01 04 08 03 07 02 
RARE: 08 02 06 04 04 06 
是 否 运算 ， 1 0 0 0 1 1 
原 染色 体 : 0 
PD 映射 。 | 
对 偶 染 色 体 :1 


图 9.4 一 个 适应 性 映射 方法 的 例子 
9.6.5 PDGA 与 DGA 


DGA 5j PDGA 的 思想 都 是 源 于 自然 界 中 普遍 存在 的 补体 机 制 。 
DGA 是 通过 元 基因 的 变异 实现 搜索 空间 中 个 体 到 其 补体 的 跳跃 ; 而 
PDCA 中 只 有 被 选 进 映射 集 D(t) 中 的 原 染 色 体 才 有 机 会 发 生 这 种 跳 
BK. Mii PDGA 和 DGA 之 间 也 存在 许多 不 同 ， 主 要 体现 在 DGA 中 互补 
染色 体 之 间 的 跳跃 是 受 变异 驱 策 的 ， 是 随机 发 生 的 。 它 并 没有 采用 显 性 
机 制 ， 对 补体 机 制 的 应 用 是 很 盲目 的 。 而 PDGA 在 染色 体 层 采 用 了 一 种 
以 适 值 作 显 性 机 制 的 方法 ， 体 现在 它 总 是 选择 低 适 值 的 个 体 进行 PD 映 
射 ， 而 且 仅 当 原 染色 体 适 值 较 差 时 才 会 被 对 偶 染 色 体 所 替换 。 

在 原始 PDGA 中 ， 对 偶 染 色 体 的 表达 是 唯一 的 ， 而 且 仅仅 被 选 和 PD 
映射 集中 的 染色 体 才 有 机 会 跳 岂 到 其 补体 。 但 是 由 于 在 种 群 中 仅仅 记录 
原 染色 体 ， 也 就 是 说 ， 染 色 体 编码 是 一 个 单 贸 链 而 不 是 像 DNA 分 子 那样 
的 双 铵 链 结构 ， 所 以 Yang 的 PDGA 实际 上 是 使 用 了 一 种 伪 二 倍 体 的 方 
法 。 而 在 采用 SPDM 方法 的 PDGA (下 文 称 之 为 IPDGA) 中 ， 一 个 染色 体 
补体 的 基因 型 具有 多 重 的 表达 形式 ， 这 与 自然 界 中 存在 的 基因 多 售 性 很 
相似 。 同 样 也 是 由 于 种 群 中 仅仅 记录 原 染 色 体 ， 因 此 ITPDGA 可 以 被 认为 使 
用 的 是 一 种 伪 多 倍 体 的 方法 。 这 样 看 来 ，IPDGA 能 够 保持 更 大 的 多 样 性 ， 
有 助 于 更 有 效 地 探索 解 空 间 。 此 外 ， 与 原始 PDGA 相 比 ， 还 有 一 点 不 同 
在 于 IPDGA 要 求 每 一 个 染色 体 都 要 参与 PD 运算 ， 这 也 是 出 于 进一步 增 
强 种 群 多 样 性 的 考虑 。PDGA 与 IPDGA 的 比较 如 图 9.5 所 示 。 


PDGA IPDGA 
Wo DEGREE 国 ” 仅 记录 原 染 色 体 
图。 补体 表达 是 唯一 的 m ”补体 表达 是 多 重 的 
e H- W EG 
E ” 仅 有 一 部 分 个 体能 够 实现 W 每 一 个 个 体 都 要 进行 PD 运算 
到 其 补体 的 跳跃 


图 9.5 PDGA 45 IPDGA 的 比较 
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9.6.6 PDGA 的 应 用 


接 下 来 验证 PDGA 算法 在 两 类 动态 优化 问题 中 的 性 能 。 一 类 是 简单 
的 动态 测试 函数 ; 另 一 类 是 在 一 种 简单 实际 动态 应 用 问题 一 动态 背包 
问题 。 在 实验 中 对 IPDGA, PDGA, DGA 和 SGA 进行 比较 ， 各 种 GAs 
都 采用 一 样 的 遗传 算 子 和 参数 : 种 群 大 小 N = 100; 单 节点 交叉 ， 交 叉 
率 P. -0.8; 位 变异 ， 变 异 率 P。 -0.001, 正比 轮 盘 选择 策略 ， 并 且 总 
是 将 父 代 和 子 代 的 所 有 个 体 中 最 好 的 N 个 个 体 保留 到 下 一 代 种 群 。 对 
T PDGA, a- 70.5, 870.9, nu «3, n, =1。 所 有 的 实验 结果 都 是 
运行 100 次 的 平均 值 。 

由 于 对 于 动态 优化 问题 来 说 ， 并 不 存在 单一 的 非 时 变 的 最 优 解 ， 算 
法 的 目标 并 不 是 获得 极 值 点 ， 而 是 尽 可 能 地 跟踪 它 在 解 空间 内 的 运动 轨 
迹 。 于 是 采用 一 种 离线 性 能 指标 一 一 累积 平均 最 优 解 *; (也 就 是 每 一 
代 获 得 的 最 优 解 的 平均 值 ) 作为 算法 性 能 的 评估 指标 。x; 可 以 计算 
如 下 ， 


iE 
aap ye (9. 13) 
各 


其 中 ，e* 是 到 :时 刻 为 止 所 获得 的 最 好 解 。 可 见 随 着 迭代 次 数 的 增加 ， 
整个 性 能 曲线 会 变 得 越 来 越 光滑 。 

1. PDGA 在 简单 动态 测试 函数 中 的 仿真 实验 

在 本 实验 中 ， 动 态 测试 函数 是 一 些 常用 的 标准 静态 优化 问题 通过 一 
定 的 动态 产生 方法 构造 的 。 

(1) 静态 优化 问题 

O 位 匹配 问题 

位 匹配 问题 是 一 种 常用 于 检验 算法 性 能 的 One - Max 问题 ， 个 体 的 
适 值 等 于 与 一 个 给 定 的 字符 串 相 匹配 的 位 的 总 数量 。 这 里 使 用 了 一 个 长 
度 为 100 的 二 进 制 的 位 匹配 函数 ， 故 其 最 优 值 为 100。 

@ Royal Road 函数 

Royal Road 函数 最 初 是 由 Michel，Forrest 和 Holland 提出 的 ， 这 里 
定义 在 一 个 长 度 为 64 位 包含 有 8 个 连续 的 8 位 Building Blocks f fi # 
上 。 函 数 的 适 值 能 够 计算 如 下 : 


8 
f(x) = ye * 6.(x) (9.14) 
1, xes 


,i=1, 2, =, 8, S= [s5 25 55, 
Sa PS 


tb, e 28, (0 -{ 
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@ Deceptive 函数 

Deceptive 函数 是 一 族 由 低 阶 模式 不 能 直接 重组 成 高 阶 模式 的 函数 ， 
这 里 的 Deceptive 函数 是 由 10 个 相同 的 3 阶 完全 Deceptive 函数 DFL Hy 
造 而 成 。DF1 被 设计 如 下 : 


fl0 0 0) =28 fO 0 1)=26 
KO 1 0)=22 fO 1 1-0 
fa 0 0)=14 fl 0 1)=0 
fl 1 0)=0 AI 1 1)=30 


可 见 ， 函 数 的 最 大 值 为 300。 

(2) 动态 测试 环境 的 产生 

下 面 介 绍 一 种 根据 给 定 的 静态 函数 产生 动态 优化 问题 的 方法 。 对 于 
一 个 给 定 的 二 进 制 编码 静态 优化 问题 f(x) ， 构 造 一 个 动态 环境 的 过 程 
如 下 : 首先 ， 随 机 产生 或 按照 某 种 控制 方式 产生 一 个 二 进 制 模板 T 
后 对 种 群 中 的 每 一 个 染色 体 * 执行 位 运算 : *x@T， 这 里 四 是 异 或 算 子 ， 
例如 1120, 150 21, 0@0 =0。 假设 环境 在 第 : 代 发 生 了 变化 ， 那 
么 在 第 t+1 代 ,有 f(x, 081) =f(x@7, !)。 

根据 上 述 动态 环境 的 产生 方法 可 知 ， 动 态 环境 是 通过 对 种 群 中 所 有 
个 体 的 位 运算 而 产生 的 ， 因 此 当 环 境 变化 后 适 值 曲 线 依然 会 保持 某 些 它 
的 初始 特性 ， 比 如 最 优 解 的 数量 和 大 小 等 。 另 外 还 能 够 发 现 ， 如 果 模 板 
7 中 的 某 一 位 为 1， 那 么 种 群 中 染色 体 x 在 进行 位 运算 时 其 对 应 位 的 值 
将 会 取 反 ， 也 就 是 说 ， 从 0 变 为 1 或 从 1 变 为 0; 如 果 了 中 的 某 一 位 为 
0， 则 x 的 对 应 位 将 保持 不 变 。 可 见 模板 7 中 1 的 位 的 总 数 能 够 表明 此 
时 环境 变化 的 剧烈 程度 。 用 s 表示 模板 了 中 1 的 位 所 占 的 比率 ， 则 可 以 
Fi s 作为 环境 变化 的 强度 。 当 s 等 于 0.1，0.5 和 0.9 时 分 别 可 以 表示 微 
弱 变 化 环境 ， 随 机 变化 环境 和 剧烈 变化 环境 。 
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(3) 实验 结果 与 分 析 

首先 比较 和 分 析 了 各 种 GA 在 动态 位 匹配 问题 中 的 实验 结果 。 最 大 
运行 代数 被 设 为 2000， 适 值 丙 数 曲 线 每 200 代 发 生 一 次 变化 ， 也 就 相 
当 于 各 算法 经 历 了 10 个 环境 的 变化 周期 。 图 9.6 显示 了 各 种 GA 算法 
在 不 同 变化 强度 的 动态 位 匹配 问题 中 的 性 能 。 


100 7 100; 

90 f YYYYYYYY 90 

80 80 

70 70 

? A | | 

50 so} : 1 
40 40 : 
30 30 | i 
20 20 = BAY 20 BEBE 
10 PDGA 10 一 PDGA 10 — PDGA 
0 IPDGA| — IPDG, — IPDGA| 


0 0 
0 500 1000 1500 2000 0 500 1000 1500 2000 0 $500 1000 1500 2000 
520.1 s=0.5 520.9 


图 9.6 各 种 GA 算法 在 不 同 强度 的 动态 位 匹配 问题 中 的 性 能 


从 图 9.6 中 能 够 发 现 ，IPDGA 在 各 种 环境 特别 是 当 s =0.5 时 都 要 
优 于 其 他 的 GA 方法 。PDGA 的 性 能 曲线 在 弱 变 化 环境 中 与 DGA 和 SGA 
的 性 能 曲线 交 公 在 一 起 ， 随 着 变化 强度 的 增 大 ，PDGA 的 性 能 逐渐 优 于 
DGA 和 SGA, DGA 的 表现 与 PDGA 类 似 ， 只 不 过 在 剧烈 变化 环境 中 其 
RRB WHF PDGA, 

在 IPDGA rp, SPDM 算 子 有 助 于 充分 保持 种 群 的 多 样 性 ， 当 环境 发 
生变 化 时 ， 能 够 使 个 体 快速 地 跳 到 最 优点 附近 。 而 对 于 PDCA ， 当 环境 
变化 不 大 时 ， 大 多 数 原 对 偶 映射 都 是 失效 的 ， 所 以 尽管 原始 的 PDM 算 
子 也 能 帮助 保持 一 定 的 多 样 性 ， 但 是 其 效率 有 时 是 很 低 的 。 由 于 元 基 
因 的 变异 是 育 目 的 ， 所 以 与 两 种 PDGA 方法 相 比 ，DGA 在 保持 种 群 多 
样 性 方面 表现 更 差 。 当 环境 发 生变 化 时 ，SGA 在 重新 初始 化 时 总 是 将 
旧 种 群 中 的 部 分 个 体 (10% ) 保留 下 来 ,使 得 其 性 能 曲线 稍稍 得 到 
改善 。 

在 Royal Road 函数 中 采用 了 与 位 匹配 问题 一 样 的 参数 设置 ， 实 验 
结果 如 图 9.7 所 示 。 从 图 9.7 中 能 够 看 到 , 与 位 匹配 问题 相 比 ， 
IPDGA 的 表现 要 远 远 优 于 PDCA, DGA 和 SGA。 而 PDGA 虽然 总 是 能 
够 比 DGA 和 SCA 获得 更 多 的 BBs， 但 是 却 不 能 像 IPDGA 那样 在 各 个 
动态 周期 内 获得 最 优 解 。DGA 的 表现 令 人 失望 ， 在 某 些 时 候 甚至 还 
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不 如 SGA。 
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图 9.7 各 种 GA 算法 在 不 同 强度 的 Royal Road 函数 中 的 性 能 

这 是 由 于 在 Royal Road 函数 中 一 个 基础 BBs 是 8 阶 的 ， 对 于 GA 来 
说 ， 想 获得 这 样 的 BBs 是 比较 困难 的 。IPDGA 中 采用 的 适应 性 的 补体 
机 制 能 够 给 任何 一 个 block 直接 转化 为 BBs 的 机 会 ， 而 在 PDGA 中 仅仅 
能 够 让 所 有 位 都 是 0 的 block 直接 转化 为 BBs。 可 见 ， 在 这 样 的 动态 环 
境 中 IPDGA E PDGA 表现 得 更 为 有 效 。 

图 9. 8 描述 的 是 关于 Deceptive 函数 的 实验 结果 。 与 图 9.6 中 的 情 
况 很 相似 ，IPDGA 表现 得 最 好 ，SGA 表现 得 最 差 ， 而 PDGA 的 性 能 优 
F DGA, 
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图 9.8 各 种 GA 算法 在 不 同 强度 的 Deceptive 函数 中 的 性 能 
所 有 的 实验 结果 都 表明 在 动态 环境 中 IPDGA 比 PDGA 表现 出 更 强 
的 鲁 棒 性 和 适应 性 。 而 DGA 采用 的 元 基因 方案 虽然 也 能 够 改善 算法 在 
动态 环境 中 的 适应 性 ， 但 是 由 于 应 用 补体 机 制 的 盲目 性 ， 其 效果 受到 了 
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限制 。 
2. PDGA 在 动态 背包 问题 中 的 应 用 
背包 问题 也 是 一 类 常用 检验 GA 性 能 的 组 合 优化 问题 ， 这 类 问题 结 
构 简单 ， 既 可 以 深入 探索 许多 组 合 特性 ， 又 可 以 通过 解决 一 系列 背包 问 
题 来 最 终 求解 更 为 复杂 的 优化 问题 。 
一 个 静态 的 背包 问题 可 以 描述 为 : 假设 需要 从 许多 物品 中 选择 一 些 
来 填充 一 个 背包 ， 存 在 n 个 不 同 的 物品 可 以 使 用 ， 每 一 个 物品 j 具 有 重 
Tit w 和 价值 。 背 包 可 以 承重 的 上 限 为 W， 问 题 是 如 何 寻找 物品 的 最 
优 组 合 从 而 在 满足 背包 承重 约束 的 基础 上 ， 使 装 人 背包 中 物品 的 总 价值 
最 大 。 费 用 、 重 量 和 承重 一 般 都 是 正 整数 。 
设 
1， 物 品 j 放 入 背包 中 ,. 
aly, 其 他 d 
则 x=(x,，x,，*…，%,) 就 能 够 表示 放 人 背包 中 物品 的 一 个 组 合 ， 这 样 
背包 问题 的 数学 描述 如 下 : 


max f(x) = Y ox; 
fa 


1,2, =, n (9.15) 


(9.16) 
s.t Su < LA 
f 

上 述 模型 描述 的 背包 问题 就 是 所 谓 的 0 -1 背包 问题 ,是 带 有 一 
个 简单 约束 的 纯 整 数 规划 ， 是 一 类 非常 重要 的 整数 规划 问题 。 为 了 便 
于 GA 求解， 常常 需要 对 模型 中 的 约束 条 件 进 行 处 理 。 这 里 采用 简 
单 的 惩罚 系数 法 对 模型 公式 (9.16) 进行 整理 后 ,模型 (9.16) 转 
化 为 


PE 
max f'(x) =f(x) + |1- — [7 
R | Ys -w| 
E EL . 1 (9.17) 


AR (9.17) 中 能 够 看 出 在 适 值 计算 过 程 中 ， 不 仅仅 对 不 可 行 解 ( 物 
品 总 重量 超过 背包 的 承重 ) 进行 惩罚 ， 甚 至 也 对 某 些 可 行 解 〈 物 品 总 
重量 小 于 背包 的 承重 ) 也 进行 一 定 的 惩罚 。 

这 里 研究 的 是 一 个 50 个 物品 的 动态 0 -1 背包 问题 ， 其 动态 性 主要 
体现 在 背包 的 承重 会 发 生变 化 。 在 两 种 状态 之 间 变 化 (背包 的 承重 在 
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两 个 值 之 间 变 化 ) 的 背包 问题 可 以 看 作 是 一 种 简单 的 振荡 系统 ， 这 样 
系统 的 变化 强度 可 以 由 两 种 承重 量 的 差 值 大 小 所 控制 ， 物 品 的 重量 和 价 
值 见 表 9. 1。 

表 9.1 50 个 项 目 背包 问题 


RAS 重量 由 价值 < 项 目 号 重量 ww 价值 5 
1 80 220 26 28 90 
2 82 208 27 30 88 
3 85 198 28 22 82 
4 70 192 29 50 80 
5 72 180 30 30 T 
6 70 180 31 45 75 
7 66 165 32 30 73 
8 50 162 33 60 72 
9 55 160 34 50 70 
10 25 158 35 20 69 
n 50 155 36 65 66 

12 55 130 37 20 65 
13 40 125 38 25 63 
14 48 122 39 30 60 
15 50 120 40 10 58 
16 32 118 41 20 56 
17 22 115 42 25 50 
18 60 110 43 15 30 
19 30 105 44 10 20 
20 32 101 45 10 15 
21 40 100 46 10 10 
22 38 100 47 4 8 

23 35 98 48 4 5 

24 32 96 49 2 3 

25 25 95 50 1 1 
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在 实验 中 ， 背 包 的 承重 分 别 在 [796, 1249] 和 [658, 1334] 之 
间 进 行 变 化 。 各 GA 算法 的 最 大 运行 次 数 设 为 1 000 次 。 每 经 过 100 f, 
背包 的 承重 量 发 生 一 次 变化 〈 从 一 个 值 变 为 另 一 个 值 ) ， 也 就 是 说 整个 
环境 将 会 振荡 5 次 ， 其 他 相关 参数 设置 与 PDCA 在 简单 动态 测试 函数 中 
的 仿真 实验 中 的 设置 相同 ， 实 验 结果 如 图 9.9 所 示 。 


$3 aio eo 89 1x0 ^p 200 400 600 800 1000 
承重 量 在 [796,1249] 之 间 变 化 承重 量 在 [658,1334] 之 间 变 化 


图 9.9 各 种 GA 算法 在 动态 背包 问题 中 的 表现 

从 图 9. 9 中 能 够 看 出 ， 当 环境 振荡 不 是 很 强烈 (承重 量变 化 幅度 
HOM) 时 ，IPDGA 表现 出 良好 的 性 能 ; PDGA 虽然 表现 也 一 直 不 错 ， 但 
总 是 要 逊 于 IPDGA; DGA 的 性 能 一 直 很 差 ， 而 SGA 却 表现 较 好 ， 甚 至 
有 的 时 候 还 要 优 于 PDGA 的 性 能 。 当 环境 振荡 比较 强烈 (承重 量变 化 
MERA) 时 ，IPDGA 和 PDGA 的 表现 差不多 ， 远 远 优 于 DCA 和 
SGA; DGA 的 表现 有 所 好 转 ， 有 的 时 候 要 优 于 SCA. 

这 也 是 由 于 PDGA 中 的 PD 映射 方法 总 是 表现 为 基因 型 空间 的 最 大 
距离 ， 而 IPDGA 能 够 根据 当前 种 群 的 收敛 程度 对 PD 映射 方法 进行 适应 
性 的 调整 ， 所 以 当 环境 变化 较为 强烈 时 ，PDGA 和 IPDGA 都 能 够 通过 
有 效 的 映射 更 快 地 找到 较 好 的 解 ， 但 是 如 果 环 境 变化 并 不 是 很 强烈 时 ， 
IPDCA 中 的 映射 方法 就 比 PDGA 中 的 更 为 适用 。 而 DGA 由 于 其 补体 机 
制 依赖 于 元 基因 位 的 随机 变异 上 ， 具 有 一 定 的 盲目 性 ， 所 以 它 的 表现 并 
不 理想 。 

受 自然 界 中 补体 和 显 性 机 制 的 启发 ， 一 种 PDGA 算法 被 提出 ， 并 且 
对 算法 中 的 相关 参数 ， 比 如 PD RIR D) 的 大 小 、PD 映射 方法 等 进 
行 了 详细 的 讨论 ， 通 过 实验 证 明 该 算法 中 的 原 对 侦 染 色 体 的 机 制 是 一 种 
有 效 的 种 群 多 样 性 保持 的 策略 ， 特 别 是 采用 了 SPDM 方法 后 ，PDGA 在 
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某 些 动态 环境 中 表现 出 很 强 的 鲁 棒 性 和 适应 性 。 


问题 与 思考 


背包 问题 也 可 以 采用 自然 数 编码 ， 试 对 文中 的 动态 背包 问题 设计 一 种 新 的 自 
然 数 编码 空间 内 的 PDGA 算法 ， 并 比较 与 一 般 GA 方法 的 性 能 ， 进 一 步 将 PDGA 算 
法 扩展 到 实 编码 空间 。 
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优化 是 从 函数 优化 发 展 起 来 的 。 第 二 次 世界 大 战 之 后 ， 随 着 运筹 学 
的 产生 与 发 展 ， 线 性 规划 、 非 线性 规划 、 动 态 规划 等 数学 规划 的 方法 获 
得 了 长 足 的 发 展 和 广泛 的 应 用 。 但 是 传统 的 数学 规划 方法 对 问题 的 描述 
有 严格 的 要 求 ， 一 般 要 求 问题 的 目标 函数 和 约束 必须 是 线性 的 ， 至 少 是 
连续 可 微 的 ， 并 要 求 目标 函数 是 凸 函 数 ， 约 束 集 是 凸 集 才能 保证 解 的 最 
优 性 。 这 些 严格 的 限制 大 大 缩小 了 数学 规划 方法 的 应 用 范围 。 

自 20 世纪 70 年 代 末 起 ， 以 遗传 算法 、 禁 忌 搜 索 和 模拟 退火 为 代表 
的 智能 优化 算法 迅速 发 展 起 来 ， 这 些 方法 有 广泛 的 普 适 性 ， 对 目标 函数 
和 约束 集 没 有 严格 要 求 ， 在 许多 行业 里 都 获得 了 广泛 的 应 用 。 以 这 些 方 
法 为 主干 的 软 计算 、 进 化 计算 ， 或 称 为 高 级 启发 式 ， 已 成 为 最 优化 方法 
应 用 的 主流 。 这 本 教材 介绍 的 就 是 这 一 阶段 的 优化 方法 。 

但 是 ， 随 着 信息 技术 、 先 进 制造 技术 的 发 展 ， 人 们 面临 的 系统 越 来 
越 大 ， 越 来 越 复 杂 ， 各 种 新 的 资源 优化 配置 问题 对 最 优化 方法 提出 了 一 
些 新 的 要 求 。 比 如 非 集中 式 、 非 时 序 性 、 非 平衡 性 等 ， 现 有 的 智能 优化 
的 方法 也 不 能 满足 这 些 要 求 。 

随 着 实际 需要 的 不 断 提高 ， 最 优化 的 发 展 又 出 现 了 一 些 新 的 趋势 。 

(1) 从 方法 定向 到 应 用 定向 转变 一 一 最 优化 已 从 问题 适应 方法 转 
变 为 方法 适应 问题 。 

(2) 问题 的 信息 特征 越 来 越 复杂 一 一 非 线 性 、 非 连续 、 非 对 称 
非 一 致 、 可 容错 都 成 为 必须 面 对 的 问题 。 

G) 从 集中 式 到 分 布 式 转变 一 一 无 论 数 学 规划 还 是 进化 计算 都 是 
集中 式 算 法 ， 即 有 一 个 唯一 的 权威 决策 者 ; 多 决策 者 自 组 织 、 自 协调 、 
互相 替补 的 优化 方法 已 经 呼之欲出 。 

(4) 从 因果 性 到 非 因果 性 (Non - Causality) 转变 一 一 迄今 为 止 谈 
论 的 问题 都 是 因果 的 ， 正 常 时 序 的 ， 即 前 因 后 果 。 由 于 复杂 社会 和 物理 
系统 中 非 时 序 现象 的 存在 ， 这 类 系统 的 优化 就 要 求 非 因果 性 的 方法 。 

(5) 从 平衡 态 向 非 平衡 态 转变 一 一 现 有 优化 方法 基本 上 都 是 针对 处 
于 平衡 态 的 问题 的 ， 近 年 来 突变 性 (Catastrophe) MARHE (Emergency) 
已 越 来 越 引起 全 社会 的 关注 ， 优 化 方法 势必 也 必须 面 对 这 类 问题 。 

近年 来 ， 出 现 了 一 批 模仿 生命 系统 特性 的 计算 方法 ， 人 们 熟知 的 人 
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工 神经 网 络 、 遗 传 算法 、 人 工 免疫 系统 、 蚁 群 算法 、 进 化 计算 便 是 这 类 
方法 的 典型 代表 。 实 际 上 ， 类 似 的 计算 方法 仍 在 不 断 地 出 现 ， 比 如 ， 模 
拟 食肉 动物 捕食 方法 的 掠夺 搜索 策略 (Predatory Search Strategy) ， 模 拟 
生物 食物 链 的 人 工 生命 算法 (Artificial Life Algorithm) 。 可 以 预期 ， 随 
着 生命 科学 和 信息 科学 的 迅猛 发 展 和 不 断 地 交叉 融合 ， 这 类 模拟 生命 系 
统 的 计算 方法 将 会 不 断 涌现 。 同 时 ， 从 现 阶 段 研究 情况 看 这 类 模拟 生命 
系统 的 计算 方法 还 是 点 对 点 的 模仿 ， 对 生命 系统 机 理 的 理解 和 借鉴 的 层 
次 还 比较 低 ， 多 数 还 停留 在 简单 模仿 阶段 。 

自 1987 年 Langton 提出 人 工 生命 的 概念 后 ， 人 工 生命 的 研究 和 应 用 
获得 了 长 足 的 发 展 。 从 最 小 的 细胞 级 到 器 官 级 、 个 体 级 、 种 群 级 ， 帮 至 
最 大 的 含 多 物种 的 生态 系统 级 的 人 工 生 命 系统 都 在 研究 之 中 。 大 自然 中 
有 着 亿 万 种 不 同 的 物种 ， 其 行为 、 功 能 和 习性 千奇百怪 、 精 彩 纷呈 ， 为 
人 工 生命 系统 的 学 习 和 模仿 提供 了 大 量 的 样本 。 这 就 启发 人 们 思考 ， 用 
人 工 生命 的 方法 模仿 生命 系统 的 多 种 功能 习性 ,创造 出 一 系列 全 新 的 复 
杂 系 统 的 计算 方法 。 这 类 方法 可 以 统称 为 人 工 生命 计算 (Artificial - 
Life Computation) 。 

人 工 生命 计算 是 借鉴 模拟 生命 系统 功能 、 行 为 和 特性 的 科学 计算 方 
法 ， 是 生命 科学 、 信 息 科学 和 运筹 学 的 交叉 研究 领域 ; 是 进化 计算 的 一 
个 新 的 分 支 ; 是 由 具有 生命 特性 的 多 智能 体 以 特定 计算 目标 为 依据 ， 有 
序 组 合 起 来 所 形成 的 计算 方法 。 

人 工 生命 计算 的 主要 研究 内 容 包 括 : 

(1) 对 现 有 的 模拟 生命 系统 的 算法 ， 包 括 人 工 神经 网 络 、 遗 传 算 
法 、 人 工 免疫 系统 、 蚊 群 算法 、 进 化 计算 、 人 工 生命 算法 等 进行 综述 、 
分 析 和 分 类 。 . 

(2) 基于 上 述 分 析 ， 归 纳 出 在 不 同 算法 中 模拟 生命 系统 的 规律 、 
法 则 和 方法 论 ， 总 结 出 相应 的 理论 。 并 进一步 提出 人 工 生命 计算 的 理论 
框架 。 

(3) 学 习 生命 科学 中 的 理论 ， 包 括 遗 传 学 、 免 疫 学 、 分 子 生物 学 、 
生态 学 ,动物 学 和 植物 学 ， 根 据 第 二 项 中 的 理论 分 析 哪 些 生命 的 行为 、 
习性 和 机 制 具有 供 科 学 计算 借鉴 和 模仿 的 潜力 。 

(4) 根据 以 上 分 析 ， 设 计 开发 针对 不 同 应 用 的 全 新 的 人 工 生命 计 
算 方法 。 

自然 界 生命 存在 的 形式 丰富 多 彩 ; 不 同 生命 的 功能 和 习性 千 变 万 
化 ; 这 些 功 能 习性 是 在 大 自然 中 经 千 百 万 年 的 考验 而 形成 的 ， 是 宝贵 的 
自然 财富 。 设 计 新 算法 的 准则 : 先 学 习 再 模仿 最 后 改进 ; 针对 一 定 的 目 
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标 需 要 ; 抽取 信息 特征 ， 改 变 物质 能 量 的 依附 关系 ; 这 样 ， 可 以 创造 出 
的 新 方法 应 该 是 无 穷 无 尽 的 。 

近年 来 国内 一 些 学 者 已 经 提出 了 一 些 具 有 人 工 生命 计算 性 质 的 算 
ik. un. 鱼 群 算法 、 食 物 链 算 法 、 雁 队 算法 、 群 落选 址 算法 等 。 但 是 由 
于 算法 的 性 能 还 不 能 和 已 有 的 算法 媲美 ， 要 得 到 国内 外 同行 的 普遍 公认 
还 需要 一 段 过 程 。 

我 们 希望 对 新 的 优化 算法 有 兴趣 的 读者 ， 大 胆 创新 、 严 谨 验 证 ， 投 
人 到 这 个 领域 中 来 ， 开 发 出 适应 新 的 实际 需要 的 优化 算法 ， 为 开创 新 的 
研究 领域 作出 贡献 。 
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